Aunque las instalaciones de hardware de DeepSeek no han publicado detalles, en general se cree que se utilizan una gran cantidad de chips de IA de NVIDIA, incluidos H100, H800, H20 y otros modelos diferentes. Sin embargo, según la última exposición, DeepSeek también ha verificado el último chip de inteligencia artificial de Huawei: Ascend 910C.

Ascend 910C quedó expuesto más tarde en 2024. Se dice que se ha suministrado en lotes a algunos clientes, incluidos Alibaba, Baidu y Tencent. El primer lote de alrededor de 70.000 unidades, con un promedio de sólo unos 20.000 yuanes cada uno.

El mensaje muestra,Ascend 910C se fabrica utilizando el proceso de 7 nm de SMIC, con un empaque integrado de doble chip. El número de transistores alcanza los 53 mil millones y la tasa de localización general ha alcanzado aproximadamente el 55%.

Puede reemplazar a NVIDIA H100 y también se utiliza para entrenamiento e inferencia de IA a gran escala. Funciona bien con diferentes tipos de datos, como FP8, FP16, FP32 y FP64.

Ascender 910C

Según el último comunicado,Los datos medidos por el equipo de DeepSeek muestran que el Ascend 910C de Huawei funciona inesperadamente bien en inferencia de IA, alcanzando aproximadamente el 60% del rendimiento del chip NVIDIA H100.

Además,A través del kernel CUNN escrito a mano y la optimización, el rendimiento de Ascend 910C se puede mejorar aún más.

Se dice queDeepSeek soporta los chips Huawei Ascend desde el primer díay mantiene de forma independiente el almacén PyTorch, que puede convertir CUDA a CUNN con solo una línea de código. El potencial para la optimización del rendimiento también es enorme y se puede lograr un mayor rendimiento mediante una optimización personalizada.

Sin embargo, cabe señalar que lo que se sabe actualmente es que el Ascend 910CAI tiene un excelente rendimiento de inferencia, peroEl rendimiento del entrenamiento de IA puede seguir siendo insatisfactorio.


Shengteng 910