Según tres personas familiarizadas con el proyecto que están profundamente involucradas en el proyecto, siguiendo el chip de desarrollo propio del competidor OpenAI, para tomar la iniciativa en el costoso sistema informático detrás del modelo grande, el desarrollador de Claude, Anthropic, ha comenzado el trabajo preparatorio para los chips de IA de desarrollo propio y ha iniciado negociaciones con Samsung Electronics, con la intención de utilizar a Samsung como un posible socio de fundición de chips.

Si esta empresa de inteligencia artificial avanza oficialmente en su proyecto de chip de desarrollo propio, Anthropic solo puede considerarse un recién llegado en el campo de los chips de inteligencia artificial de nivel de servidor de desarrollo propio. Google y Amazon AWS han estado trabajando duro durante muchos años y han lanzado con éxito chips de desarrollo propio; Meta y Microsoft también han lanzado procesadores de desarrollo propio. OpenAI se ha asociado con Broadcom para comenzar el diseño de chips de desarrollo propio a partir de 2024. El mes pasado, se lanzó oficialmente el primer producto de la cooperación entre las dos partes, el chip de inferencia Jalapeño. Este chip puede mejorar en gran medida la eficiencia operativa de modelos de lenguaje grandes.

Tres personas familiarizadas con el asunto dijeron que Anthropic aún se encuentra en la etapa de planificación: no ha determinado el posicionamiento funcional y las especificaciones de potencia informática de este procesador, ni ha finalizado el plan de implementación del chip en servidores y clústeres de servidores. Aunque la empresa ha iniciado intercambios con varias empresas de diseño de chips, aún no ha entrado en las etapas de diseño detallado, pruebas y producción en masa.

La investigación y el desarrollo de procesadores de IA es extremadamente difícil. Los ingenieros deben tener en cuenta las cinco dimensiones: velocidad informática, consumo de energía, memoria, transmisión de red y disipación de calor. Es dos veces más difícil lograr una producción en masa estable y a gran escala.

Este proyecto de autoinvestigación refleja la tendencia general de la industria: las empresas de IA representadas por Anthropic están tratando de controlar firmemente la infraestructura subyacente de modelos grandes, cubriendo recursos de cadena completa como chips, contratos de servicios en la nube, suministro de energía y centros de datos. Los modelos de IA a ultra gran escala necesitan depender de enormes grupos de procesadores para funcionar. A esta escala, incluso una pequeña mejora en la eficiencia informática puede reducir significativamente los costos operativos y liberar recursos informáticos escasos. Los chips de IA de desarrollo propio también pueden dar a las empresas de IA más poder de negociación en la competencia industrial por procesadores, salas de computadoras y recursos energéticos.

Aunque Anthropic ha comenzado a contratar ingenieros de chips, el proyecto de autoinvestigación podría eventualmente ser archivado. A principios de este mes, la compañía reclutó con éxito a Clive Chen, un miembro central del equipo de chips de desarrollo propio de primera generación de OpenAI.

En respuesta a entrevistas y preguntas de los medios, Anthropic respondió que los chips Trainium de Amazon AWS, los TPU del procesador Tensor de Google y las GPU de Nvidia siguen siendo las opciones de hardware centrales de la estrategia de expansión de la potencia informática de la compañía, y no reveló más detalles sobre la ruta de los chips de desarrollo propio; Samsung se negó a comentar sobre esta negociación de cooperación.

Samsung y Anthropic mantienen desde hace mucho tiempo vínculos de capital. Como principal fabricante de chips de memoria del mundo, en mayo de este año, Samsung unió fuerzas con otros dos gigantes importantes del almacenamiento, SK Hynix y Micron Technology, para participar en la financiación total de Anthropic de 65.000 millones de dólares. En ese momento, la oferta mundial de chips de memoria excedía la demanda y las empresas de electrónica de consumo como Apple estaban subiendo los precios de los productos. Esta inversión estratégica permitió a Anthropic vincular a los principales proveedores de chips de memoria necesarios para su propia expansión comercial.

Corea del Sur anunció recientemente un plan de inversión industrial a 10 años por valor de cientos de miles de millones, liderado por Samsung Group y SK Group (las empresas matrices de Samsung Electronics y SK Hynix, respectivamente). Las dos empresas han invertido un total de 518 mil millones de dólares para construir cuatro nuevas fábricas de chips de memoria en Corea del Sur.

Si las dos partes finalizan la cooperación de fundición, se convertirá en un pedido de gran éxito con gran influencia industrial para el negocio de fundición de obleas de Samsung. Aunque Samsung es el líder mundial en chips de memoria, ha estado tratando de expandir su negocio de fundición de chips de IA y reducir la brecha con TSMC; las líneas de producción de procesos avanzados de este último siempre han sido el punto de referencia de la industria para la fabricación de procesadores de IA de vanguardia en el mundo. Actualmente, los pedidos de chips de IA están completos y la capacidad de producción de TSMC es escasa. Samsung ha entrado en un período de ventana para promover su proceso de 2 nanómetros entre más clientes. Los medios informaron anteriormente que Google está considerando utilizar Samsung para fabricar algunos de sus procesadores tensores de TPU de próxima generación.

Dos de las tres personas familiarizadas con el asunto revelaron que Anthropic planea utilizar la tecnología de proceso de 2 nm y la tecnología de embalaje avanzada de Samsung. 2 nm es una designación de proceso industrial, no un tamaño físico. Representa una de las tecnologías de fabricación de chips más avanzadas, permitiendo a los procesadores lograr una mayor integración y un menor consumo de energía. La tecnología de empaquetado avanzada puede acortar la distancia física entre el procesador principal y la memoria de alta velocidad, aumentando considerablemente la velocidad de transmisión de datos dentro del chip.

Durante mucho tiempo, la estrategia competitiva diferenciada de Anthropic ha sido diversificar la compra de chips de servidor para evitar depender en gran medida del hardware de Nvidia como OpenAI y xAI. Actualmente, la empresa utiliza chips de servidor de IA de Amazon, Google y NVIDIA, y también está negociando el acceso a soluciones de chips de desarrollo propio de Microsoft y la startup británica Fractile.

Aunque la actual pista de chips de inferencia está en auge en términos de financiación y varias empresas se están reuniendo para realizar investigación y desarrollo, los cálculos de los medios muestran que la cuota de mercado de Nvidia ha aumentado en lugar de caer en los últimos años, alcanzando el 74%. El CEO de NVIDIA, Jensen Huang, insiste en que el rendimiento integral de sus propios chips en escenarios de inferencia todavía está por delante de todos los productos de la competencia.