La nueva programación del baño de sangre de una noche de Géminis. Sólo 7 personas en el mundo pueden ganar it

Hoy, Gemini 3 Deep Think se ha actualizado significativamente, casi superando a SOTA en todos los campos, lo que marca que las capacidades de razonamiento de la IA han entrado en una nueva dimensión. GoogleVP mostró este proyecto paralelo y el producto final se ve así.

Yao Shunyu, un académico chino que dejó Anthropic y se unió a Google, participó en Gemini 3 Deep Think

Esta vez, Deep Think puede considerarse el "cerebro más poderoso" en los campos de la investigación científica y la ingeniería integral.

Puede convertir el boceto en un práctico diagrama 3D de soporte para computadora portátil de alta fidelidad e imprimirlo directamente.

¿Qué tan aterradora es la nueva versión de Deep Think?

En el mundo de la programación, logró una puntuación asombrosa de 3455 Elo, alcanzó el nivel de campeonato mundial y entró en el top 10 de humanos en la competencia Codeforces.

En otras palabras, sólo 7 personas en el mundo derrotaron a Gemini 3 Deep Think. Hace un año, el o3 más fuerte solo ganó 2727 Elo.

En el Examen Final Humano (HLE), Gemini 3 Deep Think actualizó SOTA y logró una puntuación del 48,4%.

Incluso saturó directamente el punto de referencia ARC-AGI-2 más difícil de la noche a la mañana, superando a la competencia con un 84,6% de SOTA nuevo.

Desliza hacia la izquierda o hacia la derecha para ver

En comparación con Gemini 3 Pro, Deep Think ha logrado una ventaja general y pisó directamente a Claude Opus 4.6 y GTP-5.2.

Lo que es aún más impactante es el rendimiento real de Gemini 3 Deep Think.

Cuando Lisa Carbone, matemática de la Universidad de Rutgers, estaba investigando, le pidió que revisara un sofisticado artículo de física y matemáticas.

Como resultado, Deep Think descubrió un defecto lógico sutil que incluso los revisores humanos pasaron por alto.

La épica evolución de Gemini 3 Deep Think ha vuelto a mantener despiertos a algunos.

Actualmente, los suscriptores de Google AI Ultra pueden experimentar la nueva versión de Deep Think en Gemini. Al mismo tiempo, está abierto por primera vez a algunos investigadores, ingenieros y empresas a través de API.

La fuerza supera a SOTA, medalla de oro olímpica Grand Slam

El año pasado, Deep Think Special Edition resolvió con éxito las tareas más difíciles de razonamiento y ganó medallas de oro en el Campeonato Mundial de Matemáticas y Programación.

Ayer mismo, GoogleDeeoMind también hizo un calentamiento.

Aletheia, la "matemática de IA" respaldada por la primera generación de Deep Think, puede escribir artículos de forma independiente y demostrar múltiples problemas difíciles en la "conjetura de Erdős".

No solo eso, Deep Think anuló directamente diez años de conjeturas y superó 18 obstáculos importantes en la investigación de una sola vez.

Ahora, el Deep Think iterado ha actualizado SOTA en múltiples pruebas comparativas difíciles:

Último examen humano (HLE): establece un nuevo punto de referencia con una precisión del 48,4 % sin herramientas;

ARC-AGI-2: alcanzó un 84,6% sin precedentes y fue verificado por la Fundación Premio ARC;

Plataforma de competencia de algoritmos Codeforces: la puntuación Elo alcanzó la asombrosa cifra de 3455 puntos;

2025 IMO: Alcanzando el nivel de medalla de oro.

Además de las competiciones de matemáticas y algoritmos, Gemini 3 Deep Think ahora destaca en una amplia gama de campos científicos como la química y la física.

En la parte de prueba escrita de la Olimpiada Internacional de Física y la Olimpiada de Química de 2025, la nueva versión de Deep Think también tiene capacidades de medalla de oro.

Además, también es capaz en física teórica avanzada, logrando una puntuación del 50,5% en la prueba CMT-Benchmark.

Además, Gemini 3 Deep Think supera directamente al ARC-AGI-1.

En la demostración oficial, Gemini 3 Deep Think puede crear una solución de visualización para la arquitectura "Transformer de video en bucle espacio-temporal" basada en el documento.

Deep Think entra en la investigación científica y se acelera diez veces

Además del máximo rendimiento, Deep Think también traspasa los límites de la inteligencia y puede resolver problemas modernos en ciencia, investigación e ingeniería.

No sólo ayuda a los investigadores científicos a interpretar datos complejos, sino que también ayuda a los ingenieros a modelar sistemas físicos mediante código.

En las primeras pruebas, muchos científicos han mejorado significativamente la calidad de los resultados de la investigación en sus flujos de trabajo de investigación científica.

En Duke, el laboratorio Wang utilizó Deep Think para optimizar los métodos de fabricación para cultivar cristales complejos para el posible descubrimiento de materiales semiconductores.

Inesperadamente, Deep Think diseñó con éxito una fórmula para hacer crecer películas de más de 100 μm, logrando objetivos precisos que eran difíciles de lograr con métodos anteriores.

Anupam Pathak, jefe de I+D de Plataformas y Dispositivos de Google, dijo:

No soy diseñador CAD, pero con Deep Think puedo convertir bocetos directamente en objetos imprimibles en 3D.

Analiza dibujos, modela formas complejas y genera archivos de modelo necesarios para la impresión 3D, acelerando diez veces el modelado de componentes físicos.

Simplemente envíe una imagen y una palabra rápida, y podrá pensar profundamente y brindar varias soluciones de diseño nuevas en las que nunca antes había pensado.

Deep Think combina un profundo conocimiento científico con capacidades prácticas de ingeniería para ir más allá de la teoría abstracta y comenzar realmente a impulsar aplicaciones prácticas.

Los internautas están asombrados por la medición real, la simulación física es demasiado fuerte.

En mediciones reales, Gemini 3 Deep Think demostró sólidas capacidades de simulación física.

Puede simular el trazado de rayos y puede implementarse en el navegador.

Y también puede crear una escena Three.js completa en un único archivo HTML para representar una sala interior completamente en 3D que no se puede distinguir de las pinturas al óleo clásicas del museo.

Simon Willison utilizó Gemini 3 Deep Think para dibujar una imagen vectorial SVG de un pelícano andando en bicicleta, y el efecto fue impresionante.

Dijo que esta es la mejor versión que jamás haya visto.

Ahora que le estaba yendo tan bien con el comando básico "generar un SVG de un pelícano andando en bicicleta", Simon decidió subir la apuesta y probar una versión más desafiante:

Genera una imagen SVG de un pelícano pardo de California andando en bicicleta. La bicicleta debe tener radios y el cuadro debe tener la forma correcta. El pelícano tenía que tener su característica bolsa grande en el cuello con detalles de plumas transparentes. Debe quedar claramente visible que el Pelican está pedaleando. La imagen debe mostrar el plumaje reproductivo completo del pelícano pardo de California.

El resultado es el siguiente:

Esta vez, Google ha permitido que la IA penetre verdaderamente en la "última milla" del trabajo de investigación científica: revisión de artículos, diseño industrial, optimización experimental, todo.

Cuando la IA puede encontrar lagunas lógicas que incluso los revisores humanos ignoran, las palabras "herramienta auxiliar" obviamente ya no son dignas de mención.

Ahora, la bola de estrés ha vuelto a OpenAI.

Frente a la respuesta de "reflexión profunda" de Google que toca directamente el punto débil, la próxima carta de triunfo de Ultraman debe ser lo suficientemente impactante.

Referencias:

https://x.com/GoogleDeepMind/status/2021981512925585703

https://x.com/GoogleDeepMind/status/2021981510400709092

https://x.com/kimmonismus/status/2021983169478533148