Este Festival de Primavera, todo Internet está esperando que DeepSeek lance el último modelo grande DeepSeek V4, pero ahora parece que es posible que la versión grande no se lance durante el Festival de Primavera. Hoy, DeepSeek actualizó silenciosamente la nueva versión, que tiene muchos aspectos destacados. Según la propia introducción de DeepSeek, esta actualización mejora principalmente la capacidad de contexto, alcanzando 1M, mientras que la serie anterior DeepSee V3 era 128K.

Con un contexto de 1M, DeepSeek puede procesar textos extremadamente largos del tamaño de la trilogía "El problema de los tres cuerpos" a la vez.Esto ha sido confirmado por pruebas reales realizadas por muchos internautas.


Otras capacidades estuvieron disponibles antes y DeepSeek no mencionó información más detallada.

Vale la pena señalar que DeepSeek agregó un párrafo especial después de responder esta pregunta, enfatizando que es el último modelo de DeepSeek, sin un subnombre específico, no V3 o R1, como para enfatizar deliberadamente la diferencia de este modelo, pero no para hacer que la gente piense que esta es la versión V4 Preview.


Sin embargo, a juzgar por los comentarios de los internautas, esta pequeña actualización de DeepSeek ha mejorado enormemente sus capacidades. El conocido blogger de pruebas de modelos grandes @karminski-dentist ha publicado una prueba rápida que prueba principalmente un proyecto de prueba de pasta de dientes de elefante en términos de programación.

La conclusión es que se ha mejorado la estética visible, el modelado, la simulación física y el rendimiento del código, e incluso hay pequeñas sorpresas.Esto es SOTA más que cualquier versión lanzada antes.Es decir, el modelo grande óptimo actual (por supuesto, se refiere principalmente a la versión DS).

Aún no es seguro si el nuevo modelo de DeepSeek está completo, porque algunos internautas probaron la pregunta de si caminar o conducir hasta un lavado de autos a una distancia de 50 metros, que ha sido muy popular estos dos días. El nuevo modelo de DeepSeek dio respuestas diferentes. Algunos dijeron que era correcto y otros dijeron que no era posible.