Los vídeos generados por IA han avanzado a un ritmo vertiginoso durante los últimos 10 meses, y el nuevo y notable modelo de difusión espaciotemporal de Google, Lumiere, ha cambiado los objetivos una vez más. Lumiere puede crear videoclips surrealistas muy realistas o de alta calidad de hasta 5 segundos de duración. También puede animar imágenes estáticas o partes de imágenes basándose en indicaciones de texto en lenguaje natural para informarle lo que desea ver.
Puede tomar una fotografía, clonar el estilo de esa imagen y luego usar ese estilo para crear una serie de videos sobre otros temas que se ven y se sienten tan similares que podrían haber sido producidos por una agencia de branding.
Puede usar tu propio vídeo fuente para convertir todo en Lego, origami o flores: simplemente díselo.
Como puede ver en la demostración anterior, Lumiere tiene la función de video más avanzada que hemos visto hasta la fecha. Simplemente pintas las partes de la imagen que no te gustan y Lumiere rellenará automáticamente esa área con un hermoso efecto que quizás ni siquiera notes si no miras con atención. ¿Exnovio aparece en tu video favorito? No pasará mucho tiempo.
El equipo de investigación relevante declaró que la "arquitectura de red espacio-temporal en forma de U" de Lumiere puede construir la duración completa del video a la vez, mientras que los modelos anteriores generalmente generan el cuadro inicial y el cuadro final primero, y luego adivinan lo que sucederá en el medio.
No importa cómo lo hagas, los resultados hablan por sí solos: este es el nuevo estado del arte en video de IA generativa.
Por ahora, esto es sólo un proyecto de investigación, para que Google no tenga que castrar fuertemente el sistema por derechos de autor, desinformación, seguridad, discursos de odio, desnudez, privacidad y varias otras políticas, un proceso que conducirá inevitablemente a una disminución en la calidad de la producción de estos modelos generativos.