Arm y sus socios desarrollan una CPU con IA: Neoverse V3 CSS_5iter.com basada en Samsung GAA FET de 2 nm

Ayer, Arm anunció avances significativos en su plan de "diseño total". Lanzado hace un año, el programa tiene como objetivo acelerar el desarrollo de chips personalizados para centros de datos fomentando la colaboración entre socios de la industria. El ecosistema ha crecido hasta incluir casi 30 empresas participantes, con las recientes incorporaciones de AlcorMicro, Egis, PUFSecurity y SEMIFIVE.

Un avance digno de mención es que Arm, Samsung Foundry, AD Technology y Rebellions han colaborado para crear una plataforma de chip de CPU de inteligencia artificial. La colaboración tiene como objetivo proporcionar soluciones para cargas de trabajo en la nube, HPC y AI/ML, combinando los aceleradores de inteligencia artificial de Rebellions con los chips informáticos de AD Technology, implementados utilizando la tecnología FET Gate-All-Around (GAA) de 2 nm de Samsung Foundry.

Se espera que la plataforma aporte importantes mejoras de eficiencia a las cargas de trabajo de inteligencia artificial generativa, y se estima que para un LLM como Llama3.1 con 405 mil millones de parámetros, su eficiencia será de 2 a 3 veces mayor que la de los diseños de CPU estándar.

El enfoque de Arm enfatiza la importancia de la computación con CPU para respaldar toda la pila de IA, incluidas tecnologías avanzadas como el preprocesamiento de datos, la orquestación y la generación de aumento de recuperación (RAG). El Subsistema de Computación (CSS) de la compañía está diseñado para cumplir con estos requisitos, proporcionando una base para que los socios creen diversas soluciones de conjuntos de chips.

Varias empresas, incluidas AlcorMicro y Alphawave, han anunciado planes para desarrollar chips con tecnología CSS para una variedad de aplicaciones informáticas de alto rendimiento y inteligencia artificial. El programa también se centra en la preparación del software, garantizando que los principales marcos y sistemas operativos sean compatibles con los sistemas basados en Arm. Los esfuerzos recientes incluyen la introducción de la tecnología ArmKleidi, que optimiza la inferencia basada en CPU para proyectos de código abierto como PyTorch y Llama.cpp.

Vale la pena señalar que, como afirma Google, la mayoría de las cargas de trabajo de IA se infieren en la CPU, por lo que tiene mucho sentido construir la CPU más eficiente y de mejor rendimiento para la IA.