La imagen física del acelerador de IA Ascend 950 de nueva generación de Huawei ha sido expuesta por primera vez, mostrando la forma de empaque del chip y la memoria de alto ancho de banda (HBM) de desarrollo propio de la compañía. Este chip integra el HBM de primera generación desarrollado por Huawei y una nueva generación de unidades de aceleración de IA en el mismo paquete. Está posicionado para clústeres informáticos a gran escala y compite a través de la escala del sistema y la densidad del clúster, en lugar de rivales "incondicionales" como Nvidia en términos de rendimiento de un solo chip.

Huawei anunció anteriormente que la serie Ascend 950 está programada para lanzarse oficialmente a principios de 2026 e incluirá al menos dos modelos.

Los informes muestran que entre la serie Ascend 950, la versión 950PR integra 128 GB de HBM de desarrollo propio de Huawei, con un ancho de banda de aproximadamente 1,6 TB/s; mientras que la versión 950DT aumenta la capacidad a 144 GB y aumenta significativamente el ancho de banda a casi 4 TB/s. Los objetivos de potencia de cálculo de ambos chips son un rendimiento FP8 de nivel 1 PetaFLOPS y un rendimiento FP4 de nivel 2 PetaFLOPS para una sola tarjeta, apuntando a escenarios de entrenamiento e inferencia de modelos grandes actuales. La estrategia general de Huawei pone más énfasis en paquetes de alta densidad y redes de interconexión eficientes, y compensa la brecha en el rendimiento de un solo chip mejorando la potencia informática y la eficiencia de interconexión a nivel de gabinete y centro de datos.

En términos del proceso de fabricación, el artículo señala que actualmente no hay información del nodo de proceso confirmada oficialmente, pero la industria en general espera que el Ascend 950 probablemente utilice el último proceso N+3 de SMIC, que está clasificado como un nodo de 5 nm. SMIC anunció anteriormente que su nodo N+3 ha logrado una producción en masa sin depender de equipos EUV, y el primer cliente público es el producto terminal de Huawei equipado con Kirin 9030 SoC. En este contexto, como producto estratégico de aceleración de IA de Huawei, se considera una inferencia "natural" que Ascend 950 utilice el mismo nodo.

Desde el punto de vista físico, el Ascend 950 adopta un diseño de empaque de múltiples chips. El núcleo consta de dos chips de computación y se combina con dos chips adicionales sospechosos de E/S y relacionados con la red para formar un módulo de múltiples chips (MCM). Se cree que estos chips de red y E/S son responsables de conectar tarjetas aceleradoras a clústeres SuperPoD y SuperCluster más grandes, logrando una interconexión de alto ancho de banda de cientos de miles de tarjetas Ascend 950 a través de una nueva generación de protocolo de interconexión "Lingqu" y tecnología de interconexión óptica. Se especula que el módulo con un anillo de estructura de embalaje distribuido alrededor del troquel que parece similar a la "forma híbrida LPDDR/HBM" es el paquete HBM de desarrollo propio de Huawei. Lo más probable es que se produzca en un paquete independiente y luego se apile e integre en el sustrato del acelerador en un paquete a nivel de sistema.

En general, la ruta de diseño del Ascend 950 tiene algunas similitudes con las GPU de gama alta como NVIDIA Blackwell. Ambos utilizan paquetes de doble chip para superponer más potencia informática en una sola tarjeta y dependen de HBM de gran ancho de banda y protocolos de interconexión dedicados para construir clústeres informáticos a gran escala. La diferencia es que Huawei está más centrado en la idea de "ganar por escala" en la etapa actual, con la esperanza de formar soluciones alternativas en los mercados de potencia de centros de datos y computación en la nube de IA a través de paquetes densos, interconexión de múltiples tarjetas y soluciones de súper clústeres, al tiempo que fortalece la controlabilidad independiente de la cadena de suministro local.