LGAIResearch, sí, esa LG que desarrolla electrónica de consumo, lanzó EXAONEDeep, una inteligencia artificial de razonamiento de alto rendimiento que, a pesar de un número relativamente pequeño de parámetros, ha demostrado capacidades extraordinarias en lógica matemática, conceptos científicos y desafíos de programación.

Las métricas de rendimiento del modelo insignia 32B son comparables a las de modelos más grandes como GPT-4o y DeepSeekR1. En comparación, las variantes 7.8B y 2.4B establecen nuevos puntos de referencia en las categorías de IA liviana y en el dispositivo.

El modelo EXAONEDeep32B obtuvo 94,5 puntos en la sección de matemáticas de CSAT2025 y 90,0 puntos en AIME2024, superando a otros modelos de la competencia y requiriendo solo el 5 % de los recursos informáticos de grandes modelos alternativos como DeepSeek-R1 (671B). 

En razonamiento científico, logró una puntuación de 66,1 en la prueba GPQA Diamond, que evalúa las habilidades de resolución de problemas a nivel de doctorado en física, química y biología. El modelo obtuvo 83,0 puntos en MMLU, la puntuación más alta entre los modelos desarrollados en Corea.

De particular interés es el rendimiento de las variantes más pequeñas: el modelo 7.8B obtuvo 94,8 puntos en MATH-500 y 59,6 puntos en AIME2025, mientras que el modelo 2.4B obtuvo 92,3 puntos en MATH-500 y 47,9 puntos en AIME2024. Estos resultados colocan a los modelos más pequeños de EXAONEDeep en la cima de sus categorías en todos los puntos de referencia principales, lo que demuestra el enorme potencial para implementar EXAONEDeep en entornos con recursos limitados.

EXAONEDeep tiene hasta 32 mil millones de parámetros y funciona bien en implementaciones de una sola GPU. Curiosamente, estos modelos pueden ejecutarse en una variedad de GPU discretas, GPU de portátiles y algunos sistemas de vanguardia que no tienen capacidades informáticas a gran escala.