Aunque DeepSeek V4 no se lanzó durante el Festival de Primavera, DeepSeek lanzó un nuevo modelo el 11 de febrero, llamado DeepSeek V4 Lite, que tiene solo 200 mil millones de parámetros y es de escala relativamente pequeña. La característica principal de DeepSeek V4 Lite es el contexto 1M. En pruebas anteriores realizadas por internautas, su rendimiento no fue demasiado impresionante excepto en el contexto ultralargo. Después de todo, la escala de parámetros es muy diferente de la de los modelos grandes convencionales.

Sin embargo, DeepSeek V4 Lite se ha actualizado silenciosamente desde su lanzamiento. El 27 de febrero, algunos internautas lo probaron y descubrieron que su rendimiento es cada vez más potente. Ayer fue actualizado nuevamente. HCPTangHY, el líder de la comunidad Linux Do, también se sorprendió después de la prueba y dijo que era un poco sorprendente. En su prueba, ya era el modelo nacional SOTA (nota: SOTA simplemente puede considerarse primero).

No sólo eso, si la capacitación continúa, es posible que el código abierto pueda aprovechar el código cerrado.

A juzgar por sus pruebas, la puntuación de la actualización 0302 de DeepSeek V4 Lite es un nivel superior a la de la versión 0227 anterior.Ya se acerca al actual modelo superior de gran tamaño, el Sonnet 4.6.

Hay otros juegos y pruebas de front-end en la publicación, incluida la conocida prueba de tarjeta meteorológica en la industria. La versión DeepSeek V4 Lite 0302 está en línea tanto en términos de estética como de funcionalidad.

Si analizamos los grandes modelos de IA del año pasado, los grandes modelos nacionales ya no son muy diferentes de los modelos de código cerrado en términos de diálogo y chat.Pero queda atrás en aspectos como la multimodalidad, la programación, las matemáticas y los agentes inteligentes.Las series GLM5, MiniMax 2.5 y Qwen 3.5 lanzadas recientemente han mejorado, pero Anthropic, OpenAI y Google también han lanzado los últimos modelos y la brecha se ha ampliado nuevamente.

Para alcanzar a los principales modelos de código cerrado, las empresas nacionales enfrentan muchas desventajas. No invierten tanto como las empresas estadounidenses y su capacidad informática no es suficiente. Los datos no son tan buenos como los de Google y OpenAI. Después de todo, tienen años de acumulación o una gran cantidad de usuarios.

Además, para recopilar datos, Anthrpoic descargó una gran cantidad de libros de sitios web pirateados y se le ordenó pagar una indemnización de 1.500 millones de dólares. Esto demuestra cuánto invirtieron en esta área y cuán descarados son.

Como esperanza de todo el pueblo, DeepSeek ha establecido un punto de referencia en la exploración tecnológica. Si DeepSeek V4 Lite con 200 mil millones de pequeños parámetros funciona así, entonces vale la pena esperar la versión completa de DeepSeek V4. Después de su lanzamiento, inevitablemente tendrá un gran impacto en la IA estadounidense.