El 12 de marzo, según noticias exclusivas de "Moby Lab", se espera que DeepSeek V4 y el nuevo modelo de Hunyuan liderado por Yao Shunyu se lancen el próximo mes (abril de 2026).El 11 de marzo, OpenRouter lanzó dos nuevos modelos misteriosos: Healer Alpha y Hunter Alpha.


Según la página de OpenRouter, se describe que Healer Alpha tiene visión,audiencia, modelo totalmente modal de vanguardia de capacidades de razonamiento y acción;


Por lo tanto, la comunidad rápidamente lo vinculó con una nueva generación de modelos nacionales que aún no han sido lanzados, supuestamente capturando "la palabra rápida del sistema que exige el estricto cumplimiento de las leyes y regulaciones chinas".


https://x.com/chetaslua/status/2031983459057672455

Y el 12 de marzo, según la noticia exclusiva de "Moby Dick Labs" (Exclusivo | Liang Wenfeng traerá DeepSeek V4 para llegar a Yao Shunyu):

DeepSeek V4 se lanzará oficialmente en abril.

Como gran modelo multimodal que Liang Wenfeng ha pulido durante mucho tiempo, DeepSeek V4 no solo mejorará sus capacidades de codificación, sino que también logrará avances en la memoria a largo plazo.

Esta dirección es básicamente consistente con la investigación pública realizada por el equipo de DeepSeek en los últimos meses.

En enero de 2026, Liang Wenfeng propuso el mecanismo de "memoria condicional" en su artículo firmado "Memoria condicional mediante búsqueda escalable";

"mHC: Hiperconexiones restringidas por múltiples" de diciembre de 2025 continúa apuntando a la optimización de la arquitectura subyacente.

Ambos artículos intentan abordar los cuellos de botella de Transformer en la memoria, la estabilidad del entrenamiento y el contexto prolongado.

Según noticias exclusivas de "Moby Lab" (Exclusivo | Liang Wenfeng traerá DeepSeek V4 para llegar a Yao Shunyu):

El principal trabajo de Liang Wenfeng en los últimos seis meses ha sido compensar las deficiencias de DeepSeek en el procesamiento de contenido visual y la búsqueda por IA.

Para fortalecer las capacidades de búsqueda de IA, DeepSeek cooperó con Baidu ya el año pasado.

La dirección de iteración clave que Liang Wenfeng estableció para DeepSeek V4 esta vez es la capacidad de memoria a largo plazo.

DeepSeek V4 también se adaptará profundamente a los chips nacionales y se espera que se convierta en el primer modelo grande que se ejecute íntegramente en el ecosistema de potencia informática nacional.

Otro hecho que se ha comprobado públicamente es que el volumen de productos de DeepSeek ha elevado las expectativas del mercado.

Desde el lanzamiento de la aplicación DeepSeek hasta el 9 de febrero de 2025, las descargas acumuladas superaron los 110 millones de veces y el número de usuarios activos semanales alcanzó un máximo de casi 97 millones.

El nuevo modelo Hunyuan de Yao Shunyu

También programado para su lanzamiento en abril.

Además de DeepSeek, Tencent también prepara nuevas acciones para abril.

Yao Shunyu se desempeñó como científico jefe de IA en la Oficina General de Tencent en diciembre de 2025, y también es jefe del Departamento de Infraestructura de IA y del Departamento de Modelos de Lenguaje Grande;


En febrero de 2026, se publicó CL-bench, un documento firmado por Yao Shunyu, que propone un nuevo punto de referencia de evaluación para el "aprendizaje contextual" y continúa impulsando el enfoque de investigación de Tencent Hunyuan hacia el contexto prolongado y la disponibilidad del agente.


https://arxiv.org/abs/2602.03587

Según noticias exclusivas de "Moby Lab" (Exclusivo | Liang Wenfeng traerá DeepSeek V4 para llegar a Yao Shunyu):

Yao Shunyu también lanzará un nuevo modelo Hunyuan en abril, con una escala de aproximadamente 30 mil millones de parámetros.

Ya a principios de 2025, Yao Shunyu había aceptado la invitación de regresar a China; de hecho, la preparación de Yao Shunyu para el nuevo modelo ya había comenzado, no menos de medio año después del anuncio oficial.

A finales de enero de este año, "LatePost" también dio la noticia (registro completo de la guerra de IA entre Byte, Alibaba y Tencent: una guerra que afecta el destino):

Dentro de Tencent, Yao Shunyu pidió al equipo que no se orientara por la clasificación.


A juzgar por la trayectoria del público, esta ronda de actualizaciones de abril no será solo una competencia de parámetros.

La conocida investigación de DeepSeek se está extendiendo a la memoria a largo plazo, la multimodalidad y la arquitectura subyacente, mientras que Tencent Hunyuan está acelerando sus cursos de recuperación sobre aprendizaje contextual y evaluación de tareas reales.

Las dos rutas son muy diferentes, pero ambas intentan responder a la misma pregunta: cómo ingresar realmente al entorno de producción para la siguiente etapa de modelos grandes.