OpenAI lanza API de procesamiento Flex para tareas de IA más baratas y lentas

En un esfuerzo por competir más agresivamente con empresas rivales de IA como Google, OpenAI ha introducido Flex Processing, una opción API que ofrece precios más bajos por el uso de modelos de IA, pero con tiempos de respuesta más lentos y "falta de disponibilidad ocasional de recursos".

El procesamiento flexible es una versión beta de los modelos de inferencia o3 y o4-mini lanzados recientemente por OpenAI y está diseñado para manejar tareas de baja prioridad y "no productivas", como la evaluación de modelos, el enriquecimiento de datos y cargas de trabajo asincrónicas, dijo OpenAI.

Reduce los costos de API a la mitad. Para o3, los precios de procesamiento Flex son de $5 por millón de tokens de entrada (~750,000 palabras) y $20 por millón de tokens de salida, en comparación con los precios estándar de $10 por millón de tokens de entrada y $40 por millón de tokens de salida. Para o4-mini, Flex bajó el precio de 1,10 dólares por millón de palabras de entrada y 4,40 dólares por millón de palabras de salida a 0,55 dólares por millón de palabras de entrada y 2,20 dólares por millón de palabras de salida.

La introducción de los procesadores Flex se produce mientras los precios de la inteligencia artificial de vanguardia siguen aumentando y los competidores están lanzando modelos más baratos, más eficientes y orientados al presupuesto. El jueves, Google lanzó Gemini 2.5 Flash. El rendimiento de este modelo de inferencia es equivalente o incluso mejor que DeepSeek R1, y el costo de la palabra de entrada es menor.

En un correo electrónico a los clientes anunciando los precios de Flex, OpenAI también señaló que los desarrolladores en los niveles 1-3 de sus niveles de uso deben completar un proceso de autenticación recientemente introducido para acceder a o3. (Los niveles están determinados por la cantidad gastada en servicios OpenAI). El resumen de inferencias y la compatibilidad con la API de transmisión de O3 también requieren autenticación.

OpenAI ha dicho anteriormente que la autenticación tiene como objetivo disuadir a los malos actores de violar sus políticas de uso.

aprender más:

https://platform.openai.com/docs/guides/flex-processing