SemiAnalysis, una organización de análisis de la industria, realizó recientemente una prueba real de los planes de suscripción multinivel de OpenAI y Anthropic. Los resultados mostraron que detrás de las asequibles tarifas mensuales se esconde una enorme brecha en los subsidios a la potencia informática. La agencia compró varios planes de suscripción de las dos compañías y continuó ejecutando tareas pesadas, como programación a largo plazo y "agentes inteligentes" hasta alcanzar el límite de uso semanal, y luego calculó los costos teóricos correspondientes a estos usos en función de los precios públicos de API.

Los resultados del cálculo muestran que si se utiliza por completo la suscripción “ChatGPT Pro 20x” de OpenAI con un precio de 200 dólares estadounidenses, la facturación API correspondiente puede alcanzar un máximo de aproximadamente 14.000 dólares estadounidenses. La solución "Claude Max 20x" de Anthropic, con el mismo precio, puede acercarse a un coste teórico de token de alrededor de 8.000 dólares estadounidenses en condiciones de uso extremas. Esto significa que un pequeño número de usuarios habituales es suficiente para consumir los márgenes de beneficio originalmente limitados según el modelo de suscripción.
Según el análisis de SemiAnalysis, esta es una de las razones por las que las grandes empresas modelo prestan especial atención a la "utilización". Para Anthropic, en niveles como Claude Pro y Claude Max 5x, la empresa puede alcanzar aproximadamente el punto de equilibrio cuando el uso real del usuario alcanza aproximadamente el 20%. En comparación, los márgenes de beneficio de OpenAI son aún más reducidos: en las suscripciones ChatGPT Plus y ChatGPT Pro 5x, una vez que la utilización supera aproximadamente el 11,4%, la empresa comienza a perder dinero con ese usuario.
En los planes superiores de mayor precio, la estructura económica se endurece aún más. El informe señaló que el margen de beneficio bruto de Anthropic en las suscripciones de alto nivel era cercano a cero cuando la tasa de utilización alcanzó aproximadamente el 10%, mientras que OpenAI cayó en el rango de beneficio bruto negativo cuando la tasa de utilización era de aproximadamente el 5,7%. En otras palabras, los usuarios no necesitan alcanzar una frecuencia de uso extremadamente intensa para que estas suscripciones pasen de "productos con fines de lucro" a "productos con pérdidas".
En este contexto, cómo ajustar los precios o restringir el acceso se ha convertido en un problema difícil para los fabricantes. El modelo de suscripción de tarifa fija mensual es un factor clave en la rápida popularidad de productos como ChatGPT y Claude. Una vez que se ajustan las cuotas o se aumentan los umbrales, el impulso de crecimiento de usuarios puede debilitarse. En la actual "carrera armamentista" de modelos a gran escala, la capacidad y disponibilidad del modelo siguen siendo uno de los elementos competitivos más importantes, lo que dificulta que las empresas ajusten fácilmente sus estrategias.
Por otro lado, los cambios en la forma en que se utiliza realmente la IA también están aumentando las presiones de costos. El informe señaló que el consumo de tokens de nuevos flujos de trabajo representados por sistemas de "agentes" de múltiples pasos que llaman a herramientas de forma autónoma puede alcanzar mil veces el de las conversaciones tradicionales de una sola ronda. Este patrón de llamadas de alta intensidad ha obligado a algunas grandes empresas a reexaminar la apertura interna y las estrategias de control de costos de las herramientas de inteligencia artificial.
Según los informes, empresas como Microsoft, Meta y Amazon han reducido sus prácticas anteriores de alentar a los empleados a realizar pruebas a gran escala y promociones internas debido a la rápida expansión de las facturas internas. En un caso ampliamente publicitado, una empresa gastó 500 millones de dólares en servicios de Anthropic en sólo un mes sin establecer ninguna restricción sobre el uso de Claude por parte de los empleados, lo que provocó directamente una intervención de gestión de emergencia.

Bajo la presión de los costos y la demanda real, cada vez más empresas están comenzando a adoptar estrategias de enrutamiento de modelos más refinadas. Un enfoque consiste en traspasar problemas complejos y de alto valor a costosos "modelos de frontera" (modelos de frontera), mientras se delega el trabajo de oficina rutinario y las tareas básicas de preguntas y respuestas a modelos más baratos. Al descargar tareas de esta manera, algunas empresas pueden reducir los costos generales de IA hasta en un 95%, cita una investigación The Wall Street Journal. Vishal Misra, decano asociado de la Universidad de Columbia, señaló que las empresas no siempre necesitan grandes modelos de alto nivel que "comprendan la gravedad cuántica". Muchos modelos de código abierto son suficientes para las necesidades diarias, lo que también reducirá el espacio premium de los modelos cerrados de alto precio.
Algunas nuevas empresas de IA han realizado migraciones más radicales. Flo Crivello, fundador y director ejecutivo de la startup de asistente de inteligencia artificial Lindy, dijo que la compañía ha cambiado el 100% de su tráfico a DeepSeek V4, alejándose por completo del modelo Anthropic. En su evaluación, DeepSeek V4 era comparable en capacidades a Claude Sonnet por una fracción del costo, una migración que supuestamente le ha ahorrado a la empresa millones de dólares.
Otros optan por construir sus propios sistemas basados en modelos de código abierto, combinando datos internos con su propia infraestructura a cambio de una estructura de costos a largo plazo más controlable. Aunque este camino requiere una mayor inversión inicial, ayuda a reducir la dependencia de proveedores externos de IA en la nube y permite a las empresas tener un control más granular sobre los costos de inferencia, la seguridad de los datos y la optimización del rendimiento. En escenarios verticales específicos, los modelos internos que han sido ajustados pueden incluso superar a los modelos de vanguardia de uso general.
En el mediano y largo plazo, la industria generalmente espera que algunos costos disminuyan gradualmente con la expansión de la infraestructura, la evolución del hardware y la iteración del modelo. SemiAnalysis predice que con el nivel de capacidad de gama media a alta representado por el actual Opus 4.8, se espera que sea rentable a un precio de alrededor de 20 dólares estadounidenses al mes a través de una tecnología más madura y una potencia informática más eficiente en el futuro. Pero este juicio no se aplica a los modelos de primer nivel más avanzados, cuyos costos de funcionamiento seguirán siendo elevados en el futuro previsible y es más probable que se cobren mediante facturación API, desbloqueo de funciones escalonadas, etc., en lugar de simplemente incluirlos en un plan de suscripción unificado para las masas.
Hasta entonces, los proveedores de servicios de IA todavía necesitan lograr un difícil equilibrio entre dos direcciones: por un lado, los usuarios quieren obtener las capacidades de IA más poderosas posibles a una tarifa mensual baja y predecible; por otro lado, la potencia informática y la infraestructura subyacentes que respaldan estas capacidades siguen siendo costosas y muy sensibles a la intensidad de uso. El director ejecutivo de OpenAI, Sam Altman, también admitió públicamente que el costo de los tokens se está convirtiendo en un problema cada vez más grave y que la compañía está trabajando arduamente para optimizar los productos y la arquitectura para permitir a los usuarios lograr "más valor con menos gasto" al usar ChatGPT.