Microsoft dijo el martes que su modelo de inteligencia artificial Phi-2 funciona mejor que los productos competidores de otras compañías como Meta (MTEA) y puede ejecutarse en dispositivos. Microsoft dijo en un blog: "El modelo Phi-2 tiene sólo 2,7 mil millones de parámetros, pero en varias pruebas comparativas integrales, su rendimiento supera al del modelo de lenguaje grande (LLM) Mistral7B de la startup europea de IA Mistral, que tiene 7 mil millones de parámetros, y al modelo de IA Llama2 lanzado por Meta con 13 mil millones de parámetros".

"En particular, el modelo Phi-2 superó al Llama2 de 70 mil millones de parámetros en tareas de inferencia de varios pasos (es decir, codificación y matemáticas) (la familia de modelos Llama2 incluye tres variantes de parámetros de 7 mil millones, 13 mil millones y 70 mil millones de parámetros)".

Microsoft añadió: "Además, el rendimiento del modelo Phi-2 es comparable o mejor que el del recientemente lanzado Google Gemini Nano2, a pesar del tamaño más pequeño del modelo". Microsoft dijo que el modelo Phi-2 se lanzará en Azure Studio.

Se informa que Microsoft lanzó el modelo Phi-1 con solo 1.300 millones de parámetros en junio de este año, que es adecuado para escenarios como control de calidad, formato de chat y código. El modelo se entrena completamente con datos de alta calidad y supera a modelos similares en pruebas comparativas hasta 10 veces.

Microsoft actualizó y lanzó la versión Phi-1.5 en septiembre de este año, que también tiene 1.300 millones de parámetros y puede escribir poemas, correos electrónicos e historias, y resumir texto. En términos de sentido común, comprensión del lenguaje y razonamiento, el modelo pudo mantenerse al día con modelos con hasta 10 mil millones de parámetros en algunas áreas.

Aunque el tamaño de Phi-2, que Microsoft lanzó en una actualización en noviembre, se ha duplicado en comparación con la versión anterior, sigue siendo mucho más pequeño que otros modelos de lenguajes convencionales. Microsoft dice que Phi-2 muestra mejoras significativas en el razonamiento lógico y la seguridad, y con el ajuste y la personalización adecuados, los modelos de lenguaje pequeño son herramientas poderosas para aplicaciones en la nube y en el borde.