El modelo Claude Sonnet 4 de Anthropic ahora admite hasta 1 millón de tokens

La startup de inteligencia artificial Anthropic anunció hoy que su popular modelo Claude Sonnet 4 LLM ahora admite hasta 1 millón de tokens contextuales. Después de Google Gemini, Anthropic se convierte en el segundo proveedor de modelos importante en ofrecer 1 millón de tokens contextuales.

Anteriormente, la API de Claude Sonnet 4 solo admitía 200.000 tokens contextuales. Con esta expansión quintuplicada, los desarrolladores pueden enviar su base de código completa de más de 75.000 líneas de código en una sola solicitud.

El soporte de contexto extendido ahora se encuentra en pruebas públicas en Anthropic API y Amazon Bedrock, y próximamente Google Cloud Vertex AI. Sin embargo, el soporte de contexto prolongado actualmente está limitado a desarrolladores de nivel 4 y requiere límites de velocidad personalizados. Anthropic señala que esta función estará disponible para más desarrolladores en las próximas semanas.

Dado que las ventanas de tokens más grandes requieren una mayor potencia informática, Anthropic ha introducido precios especiales. Para mensajes de menos de 200.000 tokens, Sonnet 4 cuesta $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Para solicitudes con más de 200.000 tokens, el costo es de $6 por millón de tokens de entrada y $22,50 por millón de tokens de salida.

Los desarrolladores pueden reducir los costos mediante el uso de almacenamiento en caché rápido y procesamiento por lotes. Por ejemplo, el procesamiento por lotes puede ofrecer un descuento del 50 % en el precio de la ventana de contexto de 1 millón.

En una sesión reciente de Reddit AMA, los líderes de OpenAI discutieron el apoyo a ventanas de contexto largas para sus modelos. El director ejecutivo de OpenAI, Sam Altman, dijo que OpenAI no ha visto una fuerte demanda de los usuarios para contextos de larga duración, pero si hay suficiente interés, están dispuestos a apoyarlo. Con una potencia informática limitada, quieren centrarse en otras prioridades.

Michelle Pokrass del equipo OpenAI escribió que les hubiera gustado proporcionar un contexto más largo en GPT-5, hasta 1 millón de tokens, especialmente para casos de uso de API, pero no lo hicieron debido a la alta demanda de GPU.

El soporte de contexto 1M de Anthropic lo pone en competencia directa con Google Gemini por capacidades de contexto largo, lo que presiona a OpenAI para que reconsidere su hoja de ruta.