Impulsado por aplicaciones como AI Agent, el consumo global de palabras ha aumentado aún más. Según los últimos datos de OpenRouter, el número total de llamadas globales de modelos grandes de IA la semana pasada (del 18 al 24 de mayo) fue de 28,9 billones de tokens, un aumento del 7,4% con respecto a la semana anterior. El número de llamadas ha aumentado durante cinco semanas consecutivas y la demanda de llamadas de modelos grandes continúa liberándose.

Fuente de la imagen: OpenRouter
Entre los grandes modelos de IA de la lista, el volumen de uso semanal de los grandes modelos de IA de China alcanzó los 9,22 billones de tokens, un aumento intermensual del 19,89%; Durante el mismo período, el volumen de uso semanal de los grandes modelos de IA estadounidenses fue de 4,93 billones de tokens, un aumento intermensual del 16,27%.Las convocatorias semanales de modelos grandes de China han superado a las de Estados Unidos durante cuatro semanas consecutivas y ocuparon el primer lugar en el mundo..
Hasta ahora, DeepSeek-V4-Flash ha encabezado la lista global de llamadas de modelos grandes de IA de OpenRouter.
OpenRouter es una plataforma de llamadas y agregación de modelos de IA que proporciona un sistema transparente de facturación y monitoreo a nivel de token, con el objetivo de resolver los problemas de fragmentación de interfaces, administración de claves compleja y control de costos que enfrentan los desarrolladores al llamar a múltiples modelos de IA. Sus usuarios son principalmente desarrolladores extranjeros, y los desarrolladores chinos representan sólo alrededor del 6%.
En el país, el aumento sustancial en el número de llamadas de Token no es nada nuevo. Según la Oficina Nacional de Estadísticas, en marzo de 2026,El promedio diario de llamadas de tokens solo en China ha superado los 140 billones.; El uso diario promedio de pufs se duplicó a 120 billones en 3 meses.
CICC estima que en escenarios de uso moderado, cuando la tasa de penetración del Agente alcanza el 8%, el consumo total de Token del Agente es equivalente al del Chatbot; la popularidad del Agente muestra un efecto multiplicador en el consumo de Tokens. Con la mejora sinérgica de la complejidad de una sola tarea, el tiempo de uso y la tasa de penetración, se espera que el consumo promedio diario de tokens aumente más de 5 veces.
A medida que el consumo de elementos verbales aumenta día a día, se han lanzado una tras otra fábricas de tokens y operadores de tokens.
Según los sitios web oficiales de cada empresa, China Mobile lanzó un producto de servicio de computación Token para usuarios individuales el 21 de abril, que admite modelos de lenguajes grandes como DeepSeek y Qwen, y se puede comprar un subpaquete por tan solo 5,99 yuanes; China Telecom lanzó oficialmente una serie de paquetes de tokens comerciales de prueba el 17 de mayo, con un precio de versión básica de 39,9 yuanes al mes para clientes pequeños, medianos y micro; La sucursal de China Unicom Shanghai anunció el 16 de mayo que brindará servicios Token a los clientes de OPC de Shanghai.
Al mismo tiempo, China Telecom ha publicado un anuncio de licitación para el proyecto de adquisición centralizada de servicios de capacidad de generación "Token Factory". Tianfeng Securities señaló que los centros de datos de IA están evolucionando hacia “fábricas de tokens”, enfatizando la necesidad de capacidades de procesamiento de datos a gran escala.
Valores CITIC declaró,El surgimiento de fábricas de tokens y operadores de tokens marca la transformación de las capacidades de generación de tokens de un servicio auxiliar a un servicio estandarizado al que se le puede asignar un precio., promoverá que el mercado de alquiler de energía informática pase del actual modelo de alquiler mensual fijo basado en el tiempo de alquiler del servidor "bare metal" a un modelo facturado en función del uso real del Token.
La agencia enfatizó que cuando Token se convierta en la unidad de cálculo para la potencia informática, los proveedores de servicios de arrendamiento de potencia informática podrán cosechar plenamente los dividendos generados por la continua expansión de la demanda de Token y la rápida penetración de todos los escenarios de aplicaciones de IA. La alta prosperidad actual de la industria del arrendamiento de potencia informática se debe principalmente al desajuste entre la oferta y la demanda en el mercado nacional de potencia informática, lo que hace que las ventajas de las principales empresas de arrendamiento con recursos de chips de potencia informática de alta gama sean más prominentes. Combinando la prosperidad de la pista y la tendencia actual de la industria que se aclara gradualmente y se concentra hacia la cima, somos optimistas sobre la elasticidad del crecimiento de los principales fabricantes de alquiler de energía informática bajo la nueva ronda de tendencia de crecimiento del uso de tokens.