Durante el feriado del Primero de Mayo que acaba de pasar, algunos usuarios descubrieron que Doubao había agregado tres nuevas opciones de suscripción de membresía paga en la página de inicio de la aplicación App Store: la versión estándar cuesta 80 yuanes por mes, la versión mejorada cuesta 200 yuanes por mes para una suscripción mensual continua y la versión profesional cuesta 599 yuanes por mes, con una tarifa anual de 6088 yuanes. A modo de comparación, el coste anual de ChatGPT Pro, que también se encuentra en el campo profesional, es de unos 2.400 dólares estadounidenses (aproximadamente 16.366 RMB).

Doubao respondió más tarde que se seguirá brindando el servicio gratuito y que la versión paga es principalmente para tareas complejas y escenarios de productividad, y la solución todavía está en fase de prueba. Al cierre de esta edición, no se sabe cuándo se lanzará oficialmente la entrada paga.

La respuesta de la industria a esta medida no es uniforme, pero todas las partes han notado un hecho básico: Este es el intento de mayor precio hasta la fecha entre los productos domésticos de asistente universal de IA de extremo C.

El costo de la potencia informática es el incentivo más intuitivo. Según datos publicados anteriormente por Volcano Engine, en marzo de 2026, el promedio diario de llamadas de tokens del modelo Doubao superó los 120 billones, casi el doble que hace tres meses y más de 1.000 veces más que en mayo de 2024, cuando se lanzó. Según informes de terceros, el gasto de capital de ByteDance en 2025 será de aproximadamente 160 mil millones de yuanes, una gran proporción de los cuales se destinará a la adquisición de potencia informática de IA y la construcción de infraestructura. Esta cifra ha sido verificada en informes de múltiples corredurías.

En una estimación de costos que circuló en la comunidad tecnológica, la depreciación del hardware de una sola inferencia representa aproximadamente el 58% y el costo de la electricidad es aproximadamente el 29%. 120 billones de tokens diarios significan enormes grupos de hardware y facturas de electricidad en aumento. Esta estructura de costos hace que los servicios gratuitos a gran escala sean insostenibles y es casi sólo una cuestión de tiempo.

Doubao no es el primer jugador en hacer ajustes. En febrero de 2026, Zhipu aumentó el precio de su plan de codificación GLM en más de un 30%; en marzo, el precio del GLM-5-Turbo API volvió a aumentar un 20%; En abril, GLM-5.1 siguió aumentando el precio en un 10%. Los proveedores de la nube también están cancelando descuentos uno tras otro. Tencent Cloud anunció que a partir del 9 de mayo de 2026, los precios de los productos y servicios relacionados con la potencia informática de la IA aumentarán en un 5%.

DeepSeek superpuso la página de la aplicación por primera vez antes del lanzamiento oficial del modelo V4, activando el modo rápido y el modo experto. En ese momento, algunos expertos de la industria creían que este movimiento era que DeepSeek se estaba preparando para realizar ajustes en el posterior sistema de suscripción paga. Sin embargo, después del lanzamiento oficial de V4, comenzó a realizar descuentos a gran escala, implementó descuentos por tiempo limitado en las API y ajustó las reglas de facturación para los accesos al caché.

Cuando el mayor grupo de usuarios gratuitos comienza a establecer un umbral de pago, ya no es una consideración financiera de una determinada empresa, sino un cambio colectivo en el modelo de entrega.

Modelo pago, ¿pensado para la productividad?

El sistema de pago de tres niveles lanzado por Doubao esta vez no comienza con la conversación en sí.

Según la información de la página del producto y las personas cercanas a la empresa, las capacidades de pago se concentran en escenarios de alto consumo informático, como la generación de PPT, el análisis de datos en profundidad y la producción de cine y televisión. Funciones como el diálogo básico y el pulido de texto siguen siendo gratuitos.

La lógica de este diseño radica en la estratificación de usuarios. Los datos de QuestMobile muestran que los usuarios activos mensuales de Doubao en el primer trimestre de 2026 serán de aproximadamente 345 millones. Entre una escala de usuarios tan grande, solo una pequeña parte de los usuarios profundos consumen muchos recursos informáticos, pero su consumo de tokens es mucho mayor que el nivel promedio. Los tres niveles de fijación de precios excluyen a estos usuarios y crean una relación correspondiente entre alto consumo y pago.

Al mismo tiempo, se conservan las funciones básicas gratuitas, por lo que la gran mayoría de usuarios ligeros no se ven afectados. Esto mantiene la escala y la base básica de Doubao como aplicación a nivel nacional.

Desde la perspectiva de la competencia de productos, este ajuste tiene otra intención. Durante mucho tiempo, la versión gratuita para controlar los costos ha hecho muchos compromisos en la versión del modelo, la longitud del contexto y la profundidad de la inferencia, lo que ha llevado a algunos comentarios del mercado de que el límite superior de las capacidades de Doubao es limitado.

Anteriormente, un profesional relacionado con la IA de un importante fabricante le dijo a Phoenix.com que Doubao tenía muchas preocupaciones al probar modelos profesionales. "La dificultad más intuitiva son los usuarios a gran escala. Es muy difícil lograr el máximo rendimiento y cuidar de una enorme base de usuarios".

Pero, de hecho, el rendimiento del modelo Seed 2.0 Pro lanzado por ByteDance en febrero de este año ha entrado en el primer escalón en múltiples pruebas comparativas; el modelo de generación de video Seedance 2.0 también comparó directamente Sora de OpenAI. Uno de los propósitos de la versión paga es proporcionar un medio de entrega para estas capacidades técnicas que no esté limitado por el costo.

Otro experto de la industria dijo a Phoenix Technology: "La prioridad actual de la potencia informática dentro de Byte está en Seedance, y la mayoría de las investigaciones innovadoras deben dar paso a Seedance".

En el lado de la aplicación, se ha logrado la misión gradual de la aplicación Doubao. Desde la guerra de aplicaciones de IA durante el Festival de Primavera de este año, el DAU de los competidores más fuertes de Doubao ha disminuido significativamente. Sin embargo, el ascenso de Doubao continúa sin cesar. El último “Informe central de desarrollo de la capa de aplicaciones de IA de 2025” de QuestMobile muestra que, a partir de diciembre de 2025, la escala de usuarios activos mensuales (MAU) de aplicaciones nativas de IA nacionales ha mostrado una diferenciación gradual obvia. Entre ellos, Doubao y DeepSeek ocuparon el primer y segundo lugar con una escala activa mensual de 226 millones y 135 millones respectivamente, formando un patrón de "duopolio" y liderando toda la industria de manera discontinua.

Después de marzo, la ventaja DAU de Doubao se amplió aún más, formando una brecha de ventaja. Otro experto de la industria afirmó que los datos de plataformas de terceros muestran que el pico de DAU de Doubao ha sido de alrededor de 150 millones.

Pero ​​al mismo tiempo, el informe de QuestMobile señaló que el número de nuevos usuarios de aplicaciones de IA en el primer trimestre mostró una tendencia de extensión bidireccional de "hundimiento + cabello plateado". El uso mensual promedio de Doubao es 54,8 veces y la tasa de actividad del usuario es del 33,5%. Ambos indicadores son significativamente más altos que los de Qianwen y DeepSeek.

Los expertos de la industria mencionados anteriormente dijeron que la aplicación Doubao básicamente tiene muchos jóvenes de cabello plateado en el mercado. Esto está lejos del escenario actual de productividad que Doubao quiere robar. El modelo de pago está destinado a ayudarlo a robarle a la multitud de productividad.

¿La potencia informática explota primero?

Hasta cierto punto, la prueba de pago de Doubao significa que el jugador libre más grande del mercado chino ha tomado la iniciativa de calcular el costo del Token. Los antecedentes volverán a la consideración de la economía de los tokens.

Para usar una metáfora popular, el modelo gratuito de aplicaciones de IA de los últimos dos años equivale a una planta acuática. No sólo no cobra tarifas de agua, sino que también promete un suministro ilimitado de agua y el coste corre enteramente a cargo de la propia empresa. Cuanto más tokens se consumen, más rápido se quema el efectivo de la empresa.

Pero ​​la esencia de la “economía de tokens” es la revalorización por parte de la industria de la inteligencia artificial del modelo insostenible de “suministro gratuito de agua” mencionado anteriormente.

En la conferencia GTC de este año, Huang Renxun explicó la economía de los tokens: los tokens son un producto nuevo. Si pueden obtener más capacidad, podrán generar más Tokens y sus ingresos aumentarán.

El presidente de Volcan Engine, Tan Dai, también hizo una declaración similar. La diferencia de precio de Token refleja esencialmente la diferencia de capacidades. El modelo de próxima generación tiene capacidades más sólidas y el costo de un solo Token puede aumentar, pero el valor económico marginal creado también será mayor.

Se puede decir que el intento de carga de Doubao es una verificación de esta "economía de tokens" en el grupo de usuarios más grande de China.

El mercado de capitales ha respondido con entusiasmo. El 6 de mayo, el primer día de negociación después del feriado, el sector de chips informáticos se fortaleció colectivamente. Haiguang Information (688041) aumentó su volumen después de la apertura y alcanzó el límite diario, con su valor total de mercado superando una vez los 820 mil millones de yuanes. El Cámbrico (688256) subió más del 9%. En la dirección de chips de memoria, muchas acciones como Netac Technology, Longsys, Montage Technology y Demingli han alcanzado su límite diario o han aumentado más del 10%. El índice 50 de innovación en ciencia y tecnología aumentó bruscamente ese día.

En esta ronda de crecimiento, una lógica que se ha mencionado repetidamente es: cuando los actores gratuitos más importantes de la industria comienzan a establecer muros de pago, significa que el mecanismo de precios está confirmando la escasez de computación con IA. Después de eso, las expectativas de rentabilidad empresarial del hardware, los servicios en la nube y las capas de modelos se modificarán en consecuencia.

El director ejecutivo de AMD, Su Zifeng, también declaró intuitivamente en la última conferencia telefónica sobre informes financieros que el mercado de CPU de centros de datos se expandirá a una tasa de crecimiento anual de más del 35%, y la escala superará los 120 mil millones de dólares estadounidenses para 2030, y puede haber "escasez de capacidad extremadamente grave" en el futuro. El precio de las acciones de AMD subió más del 16% en las operaciones fuera de horario después de la publicación de su informe de ganancias.

Doubao ya no es una excepción. Todo el sector de la IA está entrando en la etapa de revalorización.

La superposición de los eventos anteriores en el tiempo forma una cadena de transmisión de precios desde el extremo del software hasta el extremo del hardware. Kaiyuan Securities declaró en un informe de investigación que el número de llamadas de tokens nacionales continúa alcanzando nuevos máximos, lo que indica que la implementación industrial de grandes modelos nacionales de IA se encuentra en una etapa de avance integral. Soochow Securities señaló además que en el primer trimestre de 2026, la industria de arrendamiento de potencia informática ha experimentado "cambios cuantitativos" en el aumento de pedidos y aumentos de precios, así como "cambios cualitativos" en la actualización del modelo de negocio de uso compartido de tokens, y por lo tanto concluyó que "2026 es el primer año en que la potencia informática de IA nacional se realizará plenamente".

Los datos de Volcano Engine también muestran que la cantidad de clientes corporativos con un uso acumulado de tokens superior a un billón ha aumentado de aproximadamente 100 a fines de 2025 a 140.

Desde el ajuste de precios de una aplicación a nivel nacional hasta el ascenso colectivo del sector de los chips, estos eventos ocurrieron de forma independiente, pero formaron una narrativa completa dentro de la misma ventana. La era libre de la industria de la IA está experimentando una contracción sistemática. Bajo el agua, la relación entre la oferta y la demanda de potencia informática está experimentando cambios fundamentales.