Meta nota interna: El nuevo Avocado es el modelo “más poderoso” de la compañía hasta date

Según un memorando interno obtenido por la revista "Information", Meta Platforms es cada vez más optimista sobre el primer modelo grande central que su recién formado equipo de IA está a punto de lanzar. El memorando, fechado el 20 de enero, fue publicado por Megan Fu, gerente de producto de Meta Superintelligence Labs, que establece claramente que el modelo de lenguaje grande de próxima generación, Avocado, ha completado el entrenamiento previo y es "el modelo básico preentrenado más poderoso de Meta hasta la fecha". La formación previa es la etapa inicial del desarrollo del modelo de IA. El modelo debe estar expuesto a datos masivos y aprender conocimientos, patrones y relaciones generales.

A la izquierda están Alexander Wang y Mark Zuckerberg.

El memorando afirma que el rendimiento de Avocado supera el mejor modelo base de código abierto actual. (El modelo básico se refiere a un modelo de lenguaje grande que solo ha completado el entrenamiento previo y aún no se ha optimizado a través de la etapa de "post-entrenamiento"; la etapa de post-entrenamiento utiliza técnicas como el aprendizaje por refuerzo de retroalimentación humana para ajustar el modelo para tareas específicas). Aunque Avocado aún no ha completado el post-entrenamiento, su reserva de conocimiento, percepción visual y capacidades multilingües están a la par con los mejores modelos post-entrenamiento.

Antes de que Avocado se lance oficialmente al público, todavía no está claro si la evaluación optimista interna de Meta sobre el progreso de su modelo de IA puede resistir la inspección externa. Pero dada la difícil experiencia de Meta con la IA durante el año pasado, incluso promover excesivamente este progreso internamente sería arriesgado para la empresa.

En 2025, el rendimiento del modelo de lenguaje grande Llama 4 de la generación anterior de Meta no cumplió con las expectativas, lo que obligó a la compañía a posponer su lanzamiento. Meta finalmente lanzó dos versiones de Llama 4: Maverick (Ranger) y Scout (Scout), pero algunos desarrolladores quedaron decepcionados con su rendimiento real.

Estos reveses impulsaron directamente una reestructuración a gran escala del negocio general de IA de Meta. La reorganización incluye: Meta adquirió Scale AI por 14.300 millones de dólares en junio del año pasado. Alexandr Wang, director ejecutivo de la startup, se unió posteriormente a Meta y fue responsable de liderar la nueva organización integral de IA: Meta Super Intelligence Laboratory. Desde entonces, Meta ha invertido una cantidad récord de dinero en el negocio de la IA: la compañía predijo recientemente que los gastos de capital en 2026, incluido el costo de la potencia informática de la IA, aumentarán aproximadamente un 73% en comparación con 2025, alcanzando entre 115 mil millones y 135 mil millones de dólares.

El progreso tecnológico de Meta en nuevos modelos puede ayudar a controlar los costos relacionados. Otro memorando de mediados de diciembre del año pasado mostró que en tareas relacionadas con texto, la eficiencia informática de Avocado es 10 veces mayor que la de Maverick y más de 100 veces mayor que la de Behemoth. Behemoth es la versión retrasada y aún no anunciada de Llama 4 de Meta el año pasado.

Meta dijo que logró avances en eficiencia al adquirir datos de mayor calidad, invertir en infraestructura de modelo y adoptar capacitación determinista, lo que garantiza que el modelo genere resultados estables bajo el mismo método de capacitación. Esta mejora de la eficiencia ayuda a reducir el consumo de energía y el costo de la investigación y el desarrollo de la IA, un factor crucial a medida que Meta se esfuerza por alcanzar a sus competidores.

El tono positivo del memorando interno de Meta se hace eco de declaraciones públicas recientes de los ejecutivos. El mes pasado, el director de tecnología de Meta, Andrew Bosworth, insinuó mejoras de eficiencia similares en una conferencia de prensa en el Foro Económico Mundial en Davos, Suiza, y dijo que el modelo de IA de Meta "funcionó extremadamente bien". Bosworth también dijo que desarrollar un modelo utilizable para los consumidores requiere mucho trabajo posterior a la capacitación.

Al mismo tiempo, en la llamada de resultados de la semana pasada, el CEO de Meta, Mark Zuckerberg, dijo sobre los primeros modelos grandes que planea lanzar el Laboratorio de Súper Inteligencia de Meta: "Espero que nuestro primer lote de modelos funcione bien, pero lo más importante es que demostrarán nuestra rápida trayectoria de desarrollo. También espero que este año sigamos lanzando nuevos modelos y avancemos constantemente en la frontera tecnológica".