El 1 de junio, Xiyu Technology lanzó oficialmente el modelo MiniMax M3 de nueva generación. Este modelo tiene capacidades de programación de vanguardia, hasta 1 millón de contexto ultralargo y admite multimodalidad nativa (imágenes, entrada de video y operaciones de escritorio de computadora). Se ha convertido en el primer modelo en China en tener estas tres capacidades al mismo tiempo y actualmente es el único modelo de código abierto.


Según divulgaciones oficiales, en el conjunto de evaluación de programación SWE-Bench Pro, M3 obtuvo una puntuación del 59,0%, superando a GPT-5.5 y Gemini 3.1 Pro, y cerca de Opus 4.7; en la evaluación del agente Claw-Eval, M3 recibió la puntuación más alta; en el conjunto de pruebas multimodal OmniDocBench, M3 obtuvo una puntuación más alta que Gemini 3.1 Pro.

M3 adopta una nueva arquitectura de atención dispersa MSA (MiniMax Sparse Attention). En 1 millón de contextos, la cantidad de cálculo por token es solo 1/20 del modelo de la generación anterior. La etapa de precarga se acelera más de 9 veces y la etapa de decodificación se acelera más de 15 veces.

MiniMax actualizó simultáneamente el Código MiniMax del producto Agente y lanzó un plan de suscripción Token Plan (Plus 49 yuanes/mes, Max 119 yuanes/mes, Ultra 469 yuanes/mes). La API M3 está abierta para su uso a partir de ahora y la versión de contexto de 512k está disponible con un 50% de descuento por tiempo limitado, con una duración de 7 días. Los pesos de los modelos y los informes técnicos estarán disponibles en código abierto dentro de 10 días.