OpenAI lanza el modelo de programación GPT‑5.1-Codex-Max diseñado para tareas de larga duración

OpenAI lanzó hoy GPT‑5.1-Codex-Max, un modelo de codificación Agentic de nueva generación diseñado para tareas de larga duración. En comparación con el modelo anterior, GPT‑5.1-Codex-Max utiliza tecnología de "compactación", que puede funcionar en múltiples ventanas contextuales e incluso puede procesar de manera confiable millones de tokens en una sola tarea. OpenAI dijo que el modelo no solo mejora el rendimiento, sino que también logra una utilización del token más rápida y eficiente.

Se entiende que el proceso de capacitación GPT‑5.1-Codex-Max cubre tareas de ingeniería de software del mundo real, como la creación de relaciones públicas, revisión de código, desarrollo front-end y preguntas y respuestas, etc., y ha superado a los modelos anteriores en muchas evaluaciones de programación de vanguardia. Por ejemplo, el modelo logró una puntuación del 77,9 % en SWE-Bench Verified (500 muestras), del 79,9 % en la evaluación SWE-Lancer IC SWE y del 58,1 % en la evaluación TerminalBench 2.0, todos superiores al rendimiento anterior de GPT-5.1-Codex.

Además de admitir plataformas Unix, GPT‑5.1-Codex-Max está específicamente capacitado para entornos Windows. En reconstrucciones complejas y bucles de agentes de larga duración, la mayoría de los modelos de codificación del mercado están limitados por la ventana de contexto y es difícil trabajar de forma continua. GPT‑5.1-Codex-Max, por otro lado, puede ejecutarse de forma autónoma durante horas o incluso decenas de horas comprimiendo automáticamente el contenido de la sesión cuando se acerca al límite de la ventana. Según los datos de pruebas internas de OpenAI, el modelo puede funcionar de forma continua durante más de 24 horas.

Además, gracias a las capacidades de razonamiento mejoradas, GPT‑5.1-Codex-Max utiliza un 30 % menos de tokens de pensamiento que GPT-5.1-Codex al completar la misma tarea en SWE-Bench Verified. A través del modo de razonamiento "Extra High (xhigh)", el modelo puede participar en un pensamiento más profundo en tareas complejas.

Actualmente, GPT‑5.1-Codex-Max se lanzó en Codex CLI, extensión IDE, productos de revisión de código y nube, y admite usuarios de suscriptores premium de ChatGPT Plus, Pro, Business, Edu y Enterprise. Al mismo tiempo, OpenAI también introducirá este modelo en la API en un futuro próximo y lo reemplazará con el modelo predeterminado en Codex.