En la Conferencia de desarrolladores de E/S de este año, Google lanzó oficialmente la nueva generación de modelos de la serie Gemini 3.5 y la nueva serie Gemini Omni. Gemini 3.5 Flash ha sido el primero en abrirse al público, mientras que Gemini Omni se centra en la capacidad de "generar vídeo a partir de cualquier entrada".
Gemini 3.5 Flash ya está disponible para todos los usuarios a través del modo AI en la aplicación Gemini y la búsqueda de Google. Google afirma que el modelo tiene un nivel de inteligencia comparable al de los grandes modelos emblemáticos en muchas dimensiones, manteniendo al mismo tiempo el rendimiento constante de alta velocidad de la serie Flash.

Según la introducción, Gemini 3.5 Flash es actualmente el agente Gemini y el modelo de generación de código más potente. Incluso supera a Gemini 3.1 Pro en pruebas comparativas relacionadas con código y agentes complejos, y mantiene el liderazgo en comprensión multimodal, por lo que también se establece como el modelo predeterminado actual. Los usuarios pueden llamar directamente a este modelo en búsquedas diarias, conversaciones dentro de la aplicación y otros escenarios para obtener respuestas y soporte de código más rápidos e inteligentes.
Gemini Omni, presentado al mismo tiempo, representa el último intento de Google en la dirección del vídeo generativo. Este nuevo modelo puede generar videos desde cualquier entrada. Los usuarios pueden combinar libremente imágenes, audio, vídeos y texto como entrada, y el modelo genera contenido de vídeo de alta calidad basado en el conocimiento del mundo real de Gemini. Una vez completada la generación, los usuarios también pueden realizar múltiples rondas de edición conversacional a través del lenguaje natural para modificar y afinar los detalles del video.
El primer modelo de la serie Gemini Omni es Gemini Omni Flash, que admite la modificación parcial o general del vídeo y puede continuar conservando la coherencia narrativa de la escena original durante múltiples rondas de creación, lo que permite a los usuarios realizar ajustes continuos sin perder la línea principal de la historia. Google dijo que este modelo tiene una comprensión más intuitiva de conceptos físicos como gravedad, energía cinética y dinámica de fluidos, lo que le permite generar escenas dinámicas más realistas y creíbles.
En términos de experiencia creativa, Gemini Omni permite a los usuarios utilizar sus propias voces y avatares para participar en la creación de vídeos, generando así avatares digitales con características personales. Para abordar los problemas de trazabilidad y seguridad del contenido sintético, todos los videos generados por este modelo estarán integrados con marcas de agua digitales SynthID para etiquetar e identificar el contenido generado por IA.
En términos de disponibilidad, Gemini Omni Flash está disponible para suscriptores globales a partir de hoy. Los usuarios que se suscriban a los planes Google AI Plus, Pro y Ultra pueden usar el modelo directamente en la aplicación Gemini y Google Flow. Al mismo tiempo, Google también está introduciendo esta capacidad en YouTube Shorts y YouTube Create de forma gratuita, lo que permitirá a más creadores experimentar la función de generación de videos basada en la tecnología Gemini en las principales plataformas de contenido.