Microsoft lanzó recientemente su modelo de imagen de generación de texto de última generación MAI-Image-2.5, e inmediatamente ocupó el tercer lugar en la última clasificación de generación de texto de Arena, lo que demuestra que su fortaleza general en el campo de la generación de imágenes de IA está claramente alcanzando a los líderes de la industria. Actualmente en esta lista, gpt-image-2 de OpenAI ocupa el primer lugar con una puntuación de 1388.
Microsoft dijo que MAI-Image-2.5 ha mejorado ampliamente su rendimiento en una variedad de estilos de imagen, puede adaptarse mejor a las indicaciones del usuario para generar imágenes y tiene mejoras significativas en la representación del texto y los detalles de la pantalla.

Microsoft lanzó inicialmente su modelo de generación de imágenes de desarrollo propio MAI-Image-1 el año pasado. El modelo ocupó sólo el noveno puesto en la clasificación Image Arena de Arena, lo que se diferenciaba significativamente de los mejores modelos de otros laboratorios en ese momento. Luego, Microsoft integró el modelo en Bing.com/create y la aplicación móvil Bing y lo puso a disposición de los usuarios. En marzo de este año, el equipo de IA de Microsoft lanzó la segunda generación MAI-Image-2, que trajo mejoras significativas en el rendimiento de la luz natural, la restauración del color de la piel, etc., y se ubicó entre los tres primeros del ranking Arena por primera vez, solo detrás de gemini-3.1-flash-image-preview de Google y gpt-image-1.5-high-fidelity de OpenAI. También está conectado simultáneamente a Copilot, Bing Image Creator y Microsoft Foundry API para que los desarrolladores puedan llamar.
Sobre esta base, la nueva generación MAI-Image-2.5 fortalece aún más las capacidades generales del modelo. Microsoft dijo que MAI-Image-2.5 puede comprender y ejecutar con mayor precisión las indicaciones de texto del usuario, las imágenes generadas son más coherentes en detalles y estructura general, y la representación del contenido de texto es más confiable. También se han mejorado las capacidades de razonamiento visual del modelo, con una comprensión más precisa de los objetos, la iluminación, las proporciones, las estructuras de las escenas y las relaciones espaciales, lo que ayuda a generar imágenes más acordes con las escenas reales y las expectativas del usuario.

Microsoft enfatizó específicamente que MAI-Image-2.5 ha logrado los avances más obvios en la representación de texto, ilustraciones estilizadas e imágenes comerciales, incluidos carteles, pruebas de empaque, creatividad de marca e imágenes de productos, etc., que pueden producir resultados de mayor calidad. En comparación con el modelo de la generación anterior, el texto en las imágenes generadas por el nuevo modelo es más claro y nítido, el diseño es más estable y los elementos visuales de la marca son más prominentes y tienen una textura más general, lo que está más en línea con las necesidades del diseño comercial y las aplicaciones de marketing.
Mustafa Suleyman, director de Microsoft AI, dijo en las plataformas sociales que MAI-Image-2.5 ocupó el tercer lugar en la clasificación de las listas de Arena Vicentina, lo que marca otro salto importante en la calidad de la generación de imágenes. También predijo que en la próxima conferencia Build, el equipo de IA de Microsoft traerá más actualizaciones y lanzamientos relacionados. Dijo que este es solo otro paso en los esfuerzos de Microsoft en el campo de las imágenes de IA y que continuará promoviendo la iteración de capacidades de modelos y formas de productos en el futuro.
Actualmente, MAI-Image-2.5 está abierto a todos los usuarios para uso de prueba a través de Arena, y los usuarios pueden compararlo y experimentarlo directamente con otros modelos en la plataforma. Según el plan de Microsoft, este nuevo modelo también se lanzará en MAI Playground y Microsoft Foundry en las próximas dos semanas, brindando a los usuarios y desarrolladores comunes opciones de creación e integración de imágenes generativas más diversas.