Google DeepMind está abriendo un nuevo modelo de IA llamado Project Genie para algunos usuarios. Los usuarios pueden generar instantáneamente un mundo virtual de cualquier estilo a través de mensajes de texto o cargando imágenes, y pueden explorarlo libremente controlando personajes o vehículos como si estuvieran jugando un videojuego. Esta función está actualmente disponible a través de una aplicación web y los usuarios que tengan una cuenta de Google Ultra en los Estados Unidos y sean mayores de 18 años pueden probarla.
Project Genie se basa en el modelo Genie 3 que Google demostró previamente a un pequeño grupo de evaluadores en agosto de 2025, y combina el modelo de generación de imágenes Nano Banana Pro propio de la compañía y el modelo multimodal Gemini para convertir señales de lenguaje natural en escenas interactivas inmersivas. Los tipos de mundos que los usuarios pueden construir son extremadamente diversos, como volar una nave espacial sobre un planeta alienígena, volar una aeronave sobre una ciudad europea al estilo de los años 50 o dejar que un tapir corra en lo profundo de la selva amazónica, etc., todos los cuales se pueden generar rápidamente con descripciones simples o fotografías de referencia.
En términos de experiencia específica, Project Genie generará fotogramas en el mundo virtual en tiempo real en función de cómo el jugador mueve al personaje y rota la perspectiva, y admite la interacción con los objetos en la escena y la respuesta a los cambios ambientales. Por ejemplo, en el video de demostración oficial, cuando una bola azul rueda sobre la hierba blanca, todo lo que pasa se "pintará" de azul, formando un efecto de trayectoria que cambia continuamente; Al mismo tiempo, la aplicación también tiene una biblioteca de plantillas mundiales incorporada para que los usuarios la creen y modifiquen para un inicio rápido.

Los usuarios no sólo pueden navegar por estos entornos, sino también cargar sus propios personajes dibujados, fotografías de objetos del mundo real, etc. como materiales, y establecer una lógica de interacción entre diferentes elementos para construir una experiencia virtual más personalizada. En algunas escenas, incluso puedes ver retroalimentación dinámica similar a la de una interfaz de navegación GPS: cuando el jugador gira o se mueve, el mapa en la interfaz también se actualiza, mejorando la inmersión y la jugabilidad.
En una entrevista con los miembros del equipo de Project Genie, Jack Parker-Holder y Diego Rivas, el YouTuber Bilawal Sidhu señaló que el sistema actual todavía tiene errores ocasionales en las demostraciones reales y cada experiencia está limitada a 60 segundos, lo cual es una de las mayores limitaciones funcionales en este momento. Sin embargo, el equipo de desarrollo declaró que en el futuro se centrará en explorar cómo dar más control sobre el entorno y el comportamiento de los personajes en la entrada del usuario, y estudiará soluciones factibles para extender la duración del mundo virtual y romper el límite superior de 60 segundos.
En cuanto a los escenarios de aplicación, el equipo de DeepMind aún no ha dado una dirección clara, pero es optimista sobre su potencial en múltiples campos. Los informes indican que se espera que Project Genie se utilice para crear rápidamente prototipos de ideas de videojuegos, ayudar a los creadores de películas a visualizar escenas y guiones gráficos, y ayudar a los estudiantes a comprender conceptos complejos o escenarios profesionales de una manera más interactiva en el aula, como simulando la participación en trabajos de rescate posteriores a un desastre, sin requerir que los usuarios tengan habilidades de desarrollo profesional.

Al autor también le preocupa que la apertura de esta tecnología irá inevitablemente acompañada de desafíos de cumplimiento y seguridad del contenido, incluido cómo establecer "barandillas" para evitar la generación de contenido dañino o inapropiado, y cómo evitar posibles problemas de infracción de derechos de autor durante el proceso de creación. Google aún no ha revelado en detalle su mecanismo de gobernanza, pero se espera que continúe ajustando las estrategias relevantes en futuras iteraciones de productos.
Actualmente, los usuarios que viven en Estados Unidos y se suscriben a Google AI Ultra ya pueden experimentar Project Genie directamente a través de la página del proyecto experimental de Google. A medida que se abra a más regiones y usuarios, este nuevo método de interacción de IA de "generar e ingresar al mundo virtual en una sola frase" puede convertirse en una de las herramientas importantes en los campos del desarrollo de juegos, el diseño creativo, la educación y la capacitación.