DeepSeek V4 se lanzará oficialmente y el precio de la API se duplicará durante las horas pico

El 29 de junio, un correo electrónico de recordatorio de actualización enviado por DeepSeek a los usuarios mostró que la versión oficial de DeepSeek V4 está programada para ser lanzada oficialmente a mediados de julio, y con ella vendrán más optimizaciones de funciones y mejoras de rendimiento, así como un mecanismo de precios de pico y valle. Según el correo electrónico, de 9:00 a 12:00 y de 14:00 a 18:00, hora de Beijing, todos los días se consideran horas pico y el precio de la llamada es el doble del precio habitual. Al mismo tiempo, DeepSeek afirmó que notificará a los usuarios por correo electrónico con 24 horas de anticipación antes de que se produzcan ajustes relevantes.

"Reducción permanente de precios" antes de "aumento de precios"

Se informa que esta no es la primera vez que DeepSeek ajusta los precios este año. El documento oficial de la API muestra que DeepSeek se factura por millón de tokens y se cobra por separado en función de los aciertos y errores de caché y los tokens de salida. Al mismo tiempo, la propia serie DeepSeek V4 tiene altos requisitos de potencia informática.

El 24 de abril, cuando DeepSeek lanzó V4 Preview, afirmó que V4 Pro tiene 1,6 billones de parámetros totales y 49 mil millones de parámetros de activación, y V4 Flash tiene 284 mil millones de parámetros totales y 13 mil millones de parámetros de activación. Ambos admiten un contexto de 1 millón de tokens.

El documento oficial también muestra que el límite de concurrencia de V4 Flash es 2500; mientras que el modelo de alto rendimiento V4 Pro tiene un límite de concurrencia de 500 y su elasticidad de oferta es más débil que Flash.

El 23 de mayo, DeepSeek anunció que convertiría el descuento anterior del 75 % en V4 Pro a un precio permanente, y que la tarifa API se reduciría del máximo anterior de 24 yuanes/millón de tokens a un máximo de 6 yuanes/millón de tokens. El mercado especuló en ese momento que podría estar relacionado con el aumento de la oferta de los chips Ascend 950 de Huawei, pero DeepSeek no respondió a esto.

Después de la reducción permanente de precio, el precio normal actual de V4 Pro es de 0,025 yuanes/millón de tokens para la entrada de aciertos de caché, 3 yuanes/millón de tokens para los fallos de caché y 6 yuanes/millón de tokens para la salida. Los precios correspondientes de V4 Flash son 0,02 yuanes, 1 yuan y 2 yuanes respectivamente. Durante las horas pico, estos precios se duplicarán, pero seguirán siendo más bajos que cuando se publicaron anteriormente.

Para los usuarios normales, es posible que este ajuste no se refleje directamente en los cambios en los cargos de las aplicaciones de chat; los principales afectados son desarrolladores, empresas de aplicaciones de inteligencia artificial y clientes empresariales que acceden al modelo DeepSeek a través de API.

Tomando V4 Pro como ejemplo, al calcular los tokens de salida, si una aplicación de IA consume 100 millones de tokens de salida por día durante las horas pico, el costo normal es de aproximadamente 600 yuanes y el precio máximo es de aproximadamente 1200 yuanes; si consume mil millones de tokens de producción por día, el costo aumenta de aproximadamente 6.000 yuanes a 12.000 yuanes. Para aplicaciones de alta frecuencia, como servicio al cliente, asistentes de codificación, agentes de oficina y preguntas y respuestas mejoradas con búsqueda, duplicar el precio puede afectar directamente los márgenes de beneficio bruto y las estrategias de llamadas.

No se trata de renunciar a la ruta de los precios bajos

En la actualidad, la introducción de precios pico y valle por parte de DeepSeek no significa renunciar a la ruta de los precios bajos. Para ser más precisos, DeepSeek simplemente volvió a estratificar los recursos informáticos según los períodos de uso, de modo que su estrategia de precios bajos comenzó a cambiar de un precio unificado a un precio refinado.

Porque solo a juzgar por el precio de los tokens, DeepSeek todavía se encuentra en el rango "realmente fragante" de bajo precio después de la introducción de las horas pico y valle, y sigue siendo muy competitivo en el mercado internacional. Esta es también la razón del aumento de precio de DeepSeek.

Según la página de precios de la API en inglés de DeepSeek, el precio de salida de V4 Pro es de 0,87 dólares estadounidenses por millón de tokens, lo que equivale aproximadamente a 1,74 dólares estadounidenses según la duplicación máxima. Por el contrario, la página de precios oficial de OpenAI muestra que el precio API estándar de GPT-5.5 es $5 por entrada, $0,5 por entrada de caché y $30 por salida/millón de tokens; El precio normal de Claude Opus 4.8 de Anthropic es de $5 por entrada y $25 por salida/millón de tokens.

Si solo miramos los tokens de salida, el precio de los modelos de gama alta de OpenAI y Anthropic sigue siendo entre 14 y 17 veces el precio máximo de DeepSeek V4 Pro.

Por otro lado, a medida que el modelo de precios de los modelos grandes en los mercados extranjeros pasa de las suscripciones fijas a la facturación mediante tokens, los costos de uso de las empresas han comenzado a aumentar dramáticamente. Muchas empresas extranjeras con presupuestos limitados están recurriendo cada vez más a modelos de bajo costo como DeepSeek.

Según informes anteriores, tomemos como ejemplo el software de llamada de taxis Uber. Después de que cambió el modelo de precios del modelo grande, el presupuesto de IA de la empresa para todo el año se consumió rápidamente en solo 4 meses, lo que obligó a la empresa a restringir su uso por parte de los ejecutivos. Tuvo la suerte de ser "la primera gran empresa que dejó de gastar dinero en IA".

Los ejecutivos de Microsoft, Coinbase y otras empresas también han comenzado a enfatizar que muchas tareas empresariales no siempre requieren los modelos más grandes y caros. Estos cambios han empujado a las empresas a adoptar más "enrutamiento multimodelo", es decir, asignar tareas simples a modelos baratos y tareas complejas a modelos de alta gama.

Por lo tanto, los datos de OpenRouter muestran que los modelos de código abierto representaron aproximadamente el 65% del volumen de procesamiento de tokens en su plataforma. Entre ellos, el uso de modelos de bajo costo en China, representado por DeepSeek, ha aumentado significativamente, lo que intuitivamente refleja que los usuarios extranjeros han entrado en la era de la "consciencia de los costos".