Se lanzó ChatGPT-5, por lo que no está muy lejos una actualización importante de la versión del modelo grande nacional DeepSeek.A juzgar por las preguntas de los internautas a DeepSeek, la respuesta dada por el modelo es que se espera que DeepSeek-R2 se lance entre el 15 y el 30 de agosto de 2025.

En este contexto, los precios de las acciones de muchas empresas de la cadena de potencia informática nacional se han disparado. Por ejemplo, Cambrian ha alcanzado hoy un límite diario de 20 cm, el precio de sus acciones alcanzó un récord y su valor de mercado superó los 355 mil millones de yuanes.
Según declaraciones anteriores, el modelo grande DeepSeek-R2 utilizará un modelo experto híbrido (MoE) más avanzado, que se combina con una capa de red de compuerta más inteligente (Gating Network) para optimizar el rendimiento de tareas de inferencia de alta carga.
Algunos analistas predicen que el precio de DeepSeek-R2 puede ser significativamente más bajo que el de productos similares de OpenAI, lo que indica que puede subvertir el modelo de precios de los servicios de IA existentes.
Además, noticias relevantes muestran que se espera que DeepSeek-R2 cueste un 97% menos que GPT-4; y está capacitado en la tarjeta Ascend, enfocándose en un control integral e independiente de toda la cadena industrial.
Según fuentes relevantes, el número total de parámetros de DeepSeek-R2 puede alcanzar 1,2 billones, lo que representa aproximadamente el doble de los 671 mil millones de parámetros de DeepSeek-R1.
DeepSeek-R2 es un modelo entrenado basado en el grupo de chips Ascend 910B de Huawei. Tiene una potencia informática de 512 PetaFLOPS con precisión FP16 y una eficiencia de uso del chip del 82%.
Según las estadísticas de Huawei Labs, este rendimiento equivale aproximadamente al 91% del clúster de entrenamiento A100 de la generación anterior de NVIDIA. Queda por ver si son reales o no, pero parece ser más poderoso y autónomo.