La "figura del alma" de Géminis anunció oficialmente que se unió a xAI, y Musk rápidamente lo retuiteó

El desarrollador principal de Gemini, Dustin Tran, anunció oficialmente ayer que cambió su trabajo de Google DeepMind a xAI para desarrollar una nueva generación de Grok. Musk también retuiteó el tweet inmediatamente, confirmando que la noticia de que este nuevo colega se unió a xAI era cierta:

Se sabe por el anuncio oficial que Dustin Tran se unió a xAI durante al menos unas semanas y participó en el desarrollo de Grok 4 Fast, pero no modificó la introducción de su título externo hasta hoy, incluso más lento de lo que Musk retuiteó.

Esto también fue descubierto y ridiculizado por internautas perspicaces:

El nuevo colega de Dustin Tran, el miembro fundador de xAI, Toby Pohlen, quien también cambió de trabajo desde Google DeepMind, también envió inmediatamente un tweet para darle la bienvenida al nuevo colega:

Algunos internautas también están preocupados por las restricciones impuestas por las cláusulas de no competencia:

La prohibición de California de las cláusulas de no competencia permite que los talentos fluyan libremente entre las empresas, lo que generalmente se considera una garantía importante para la vitalidad innovadora de California.

Dustin Tran, desarrollador central de Gemini

Dustin Tran es el desarrollador principal de Gemini desde sus inicios hasta los últimos modelos.

En 2014, se graduó de la Universidad de California, Berkeley, con una licenciatura en matemáticas y estadística. Luego ingresó a la Universidad de Harvard para realizar un doctorado en estadística. Dos años más tarde, se trasladó a la Universidad de Columbia para realizar un doctorado en informática y lo recibió en 2018.

Sus artículos actuales han recibido más de 24.000 citas.

También ganó numerosos premios durante sus estudios de doctorado, incluida la Beca de Doctorado de Google:

Su currículum de trabajo es bastante conciso: hizo una pasantía en el puesto de investigación de OpenAI en 2017, y ese mismo año ingresó al puesto de investigación de Google Brain como pasante y permaneció allí durante 8 años.

En el largo tweet oficial que anuncia su renuncia, repasó con cariño sus ocho años de trabajo en Google, su viaje para encontrar a Gemini del caos y su decisión de unirse a xAI debido a su enorme potencia informática:

Me despedí oficialmente de Google DeepMind y finalicé mi viaje de 8 años. Hay muchos buenos recuerdos en el camino: desde los primeros días de participación en algunos artículos fundamentales en Google Brain (trabajando en Image Transformer, Tensor2Tensor, Mesh con @noamshazeer, @ashvaswani, @lukaszkaiser TensorFlow), y luego fue responsable de la evaluación posterior al entrenamiento de Gemini, poniéndose al día y conectándose en 100 días; luego llevó al equipo a dar un salto, ganando el primer lugar en LMArena (¡y manteniendo el primer puesto durante más de un año!); y finalmente participó en la innovación de inferencia de Gemini que ganó medallas de oro en la OMI y el ICPC (junto con @HengTze y @quocleix).

El viaje de Gemini ha estado lleno de altibajos, experimentando constantemente cambios de paradigma: inicialmente, transformamos el modelo LaMDA (¡el primer chatbot tipo comando!) para evolucionarlo de un simple chatbot a uno que pueda dar respuestas más largas e informativas a través de RLHF; Más tarde, exploramos la mejora de las capacidades de razonamiento y pensamiento profundo mediante entrenamiento de pensamiento de cadena larga, entornos novedosos y cabezas de recompensa. Al principio, el mundo exterior no era en general optimista. Mucha gente sintió que Google estaría condenado al fracaso debido al bagaje histórico de las búsquedas y la política interna. Pero ahora, Gemini no sólo ocupa el primer lugar en las preferencias de los usuarios durante mucho tiempo, sino que también continúa promoviendo nuevos avances científicos. En cambio, todo el mundo siente que la victoria de Google es natural. (En el pasado, cada vez que Google obtenía nuevos resultados, OpenAI siempre confiaba en que su acumulación de ideas se publicara primero para aprovechar el ciclo de noticias de IA; pero se puede decir que su "inventario" ahora se ha agotado).

Luego me uní a xAI. En realidad, el secreto es muy claro: potencia informática, datos y aproximadamente O (100) personas inteligentes y trabajadoras, esto es todo lo que se necesita para ganar el modelo de lenguaje grande de vanguardia. xAI realmente cree en esto. En términos de potencia informática, incluso en Google, nunca he visto este tipo de escala de "chip per cápita" (y pronto habrá más de 100.000 GB200/300.000+ GB300 en Colossus 2). En cuanto a los datos, Grok 4 hace la mayor apuesta en RL y escalamiento posterior al entrenamiento. xAI apuesta ahora por la expansión de datos, el pensamiento profundo y las recetas de formación. El equipo también se movió extremadamente rápido: en un período de tiempo tan corto, ninguna otra empresa puede alcanzar el nivel actual de capacidades de IA de xAI. Como dijo @elonmusk, la primera y segunda derivada de una empresa son las más críticas: el impulso de desarrollo de xAI es el más rápido.

Me complace anunciar que, dentro de las primeras semanas de unirme, lanzamos Grok 4 Fast. Grok 4 es un excelente modelo de inferencia y todavía ocupa el primer lugar en ARC-AGI y nuevos puntos de referencia como FinSearchComp. Pero funciona lentamente y no está diseñado originalmente para las necesidades generales del usuario. Grok 4 Fast es uno de los mejores modelos livianos: ocupa el puesto 8 en LMArena (¡Gemini 2.5 Flash ocupa el puesto 18!). En evaluaciones de inferencia central (como AIME), puede competir con Grok 4 y cuesta 15 veces menos. Un agradecimiento especial a @LiTianleli, @jinyilll, @ag_i_2211, @s_tworkowski, @keirp1, @yuhu_ai_.

Gemini ha logrado resultados tan sobresalientes ahora, lo que también nos hace esperar las sorpresas que Dustin Tran puede traer a Grok 5.

La enorme potencia informática de Colossus 2

Invoca un poderoso Grok 5

En nuestro artículo anterior, también realizamos un análisis detallado de Colossus 2, que Musk está construyendo intensivamente: ¡Musk está quemando 14 billones y 50 millones de potencia informática H100 estarán en línea en cinco años! La explosión final alcanza miles de millones

La enorme potencia informática de Colossus 2 refleja la ambición descarada de Musk: realizar AGI e incluso ASI es el objetivo que persigue Grok 5 e incluso modelos posteriores de xAI.

Como el hombre más rico del mundo, Musk necesita utilizar un poder informático astronómico para mantener a raya a todos sus oponentes.

La máxima potencia informática atrae a los mejores talentos.

Musk no quiere perderse todos los factores de producción para construir una poderosa IA lista para usar.

Esperemos y veamos qué tan poderoso nos puede traer Grok 5 con la incorporación de Dustin Tran.