La Academia China de Tecnología de la Información y las Comunicaciones anunció hoy que lanzó oficialmente la prueba de adaptación de localización de DeepSeek V4 para promover una colaboración profunda entre el modelo y el software y hardware nacional y acelerar la implementación industrial.Esta prueba se llevó a cabo con base en el Laboratorio Clave del Ministerio de Industria y Tecnología de la Información y el sistema de referencia AISHPerf, y abarcó productos de software y hardware de IA de pila completa, como chips, servidores, máquinas todo en uno, clústeres, cadenas de herramientas de desarrollo y plataformas informáticas inteligentes, centrándose en los procesos de inferencia y ajuste de la serie completa de modelos DeepSeek V4.
La evaluación evalúa desde cinco dimensiones: facilidad de adaptación, integridad funcional, efecto de optimización, rendimiento y costo, y recientemente agrega indicadores especiales como procesamiento de secuencia, capacidades de código, tasa de éxito de llamadas de agentes y desmontaje de tareas para formar un sistema de evaluación tridimensional.
El día de su lanzamiento, DeepSeek V4 logró la adaptación del Día 0 para múltiples hardware domésticos, lo que marca la entrada del software y hardware de IA domésticos en la etapa de iteración de la misma frecuencia.
Esta prueba verificará objetivamente el nivel de adaptación, fortalecerá el soporte de la potencia informática nacional y acelerará la construcción de un ecosistema de IA independiente y controlable.
DeepSeek V4 incluye dos versiones: V4-Pro (Flagship Edition) y V4-Flash (Lightweight Edition). Ambas versiones admiten de forma nativa 1 millón de contextos token ultralargos (aproximadamente 750 000 palabras). Adoptan un mecanismo de atención dispersa DSA de desarrollo propio para reducir el costo de inferencia para un millón de contextos en un 70% y reducir el uso de memoria en un 40%.
V4-Pro: Los parámetros totales alcanzan los 1,6 billones y los parámetros de activación son 49B. Se centra en el límite de rendimiento máximo, puntos de referencia frente a los mejores modelos de código cerrado del mundo, como GPT-5 y Claude Opus, y es adecuado para razonamiento complejo, generación de código, cálculos de investigación científica y otras tareas difíciles.
V4-Flash: Parámetros totales 284B, parámetros de activación 13B, centrándose en alta eficiencia y bajo costo, capacidad de razonamiento cercana a la versión Pro, velocidad más rápida, precio más bajo, adecuado para interacción diaria, creación de contenido, implementación liviana empresarial y otros escenarios.
