Hoy, DeepSeek anunció oficialmente que DeepSeek-V3.1 ha sido lanzado oficialmente. Según los informes, esta actualización incluye los siguientes cambios importantes: arquitectura de razonamiento híbrido: un modelo admite tanto el modo de pensamiento como el modo de no pensamiento; mayor eficiencia de pensamiento: en comparación con DeepSeek-R1-0528, DeepSeek-V3.1-Think puede dar respuestas en menos tiempo; Capacidades de agente más sólidas: a través de la optimización posterior a la capacitación, el rendimiento del nuevo modelo en el uso de herramientas y las tareas de los agentes se ha mejorado enormemente.

La aplicación oficial y el modelo web se actualizaron simultáneamente a DeepSeek-V3.1. Los usuarios pueden cambiar libremente entre el modo de pensamiento y el modo de no pensar a través del botón "Pensamiento profundo".

Agente de programación: en la evaluación de reparación de código SWE y la prueba de tarea compleja (Terminal-Bench) en el entorno de terminal de línea de comando, DeepSeek-V3.1 ha mejorado significativamente en comparación con los modelos anteriores de la serie DeepSeek.


Agente de búsqueda: DeepSeek-V3.1 ha logrado grandes mejoras en múltiples indicadores de evaluación de búsqueda. En la prueba de búsqueda compleja (browsecomp) que requiere razonamiento de varios pasos y la prueba difícil multidisciplinaria de nivel experto (HLE), el rendimiento de DeepSeek-V3.1 ha estado significativamente por delante del R1-0528.


Los resultados de la prueba muestran que después del entrenamiento de compresión de la cadena de pensamiento, el rendimiento promedio de V3.1-Think en varias tareas es el mismo que el de R1-0528, mientras que la cantidad de tokens de salida se reduce entre un 20% y un 50%. Al mismo tiempo, también se ha controlado eficazmente la longitud de salida de V3.1 en modo sin pensamiento. En comparación con DeepSeek-V3-0324, puede mantener el mismo rendimiento del modelo con una longitud de salida significativamente reducida.


Además, a partir de la madrugada del 6 de septiembre, el precio de llamada de la interfaz API de la plataforma abierta DeepSeek se ajustará de la siguiente manera.