Google lanzó recientemente una importante actualización para su chatbot Gemini: después de que los usuarios hacen preguntas, el sistema no sólo puede responder con texto, sino también generar directamente modelos 3D interactivos y escenas de simulación física. Esto significa que cuando los usuarios quieran “ver un problema”, Gemini ahora puede hacerlo a través de una visualización 3D giratoria y escalable con control de parámetros.

Según Google, después de habilitar nuevas funciones, Gemini proporcionará múltiples métodos de interacción al mismo tiempo al generar modelos o simulaciones 3D. Los usuarios no solo pueden arrastrar para rotar el modelo y ampliar los detalles, sino también ajustar manualmente las variables mediante controles deslizantes o ingresar diferentes valores para observar los cambios en tiempo real. Para preguntas que involucran procesos físicos o conceptos abstractos, se espera que este tipo de visualización interactiva se convierta en un nuevo tipo de forma de respuesta.

En la experiencia real, el periodista tomó como ejemplo de prueba "generar una simulación de la Luna orbitando la Tierra". Luego, Gemini genera una escena visual tridimensional: los usuarios pueden ajustar la velocidad de revolución de la luna con controles deslizantes, ocultar o mostrar las líneas de trayectoria que representan la órbita con interruptores y pausar o continuar la demostración con botones. Al mismo tiempo, los usuarios también pueden hacer zoom y rotar todo el conjunto de modelos 3D para observar el proceso de movimiento desde diferentes perspectivas.

Antes de esto, Gemini admitía la generación de imágenes planas interactivas basadas en las indicaciones del usuario, pero todavía estaba limitado a la interacción a nivel de imagen. Esta actualización amplía las capacidades a modelos 3D y simulaciones dinámicas, enriqueciendo aún más los medios para la comprensión y presentación de conceptos complejos asistida por IA. Esta actualización también se produce en medio de la competencia entre los grandes proveedores de modelos por “respuestas visuales”: no hace mucho, Anthropic introdujo la capacidad de generar automáticamente gráficos, esquemas y otras visualizaciones interactivas para Claude, mientras que OpenAI también agregó herramientas de visualización para conceptos matemáticos y científicos a ChatGPT.

Actualmente, todos los usuarios de la aplicación Gemini pueden experimentar esta nueva función seleccionando el modelo "Pro". La ruta de operación es: cambiar el modelo a Pro en la aplicación y luego realizar solicitudes a Gemini como "Muestra un sistema de doble péndulo" y "Ayúdame a visualizar el efecto Doppler". Después de que Gemini devuelva la descripción del texto, aparecerá un botón "Muéstrame la visualización" en la parte inferior de la interfaz. Haga clic en él para generar el modelo 3D o escena de simulación correspondiente.