Después de años de producir chips que pueden usarse tanto para el entrenamiento como para la inferencia de modelos de inteligencia artificial, Google está dividiendo las dos tareas en diferentes procesadores, su último movimiento para competir con Nvidia en el campo del hardware de inteligencia artificial. Google anunció el miércoles que realizará este cambio en su unidad de procesamiento tensorial (TPU) de octava generación, y ambos chips se lanzarán a finales de este año.

Amin Wahdat, vicepresidente senior y director de tecnología de inteligencia artificial e infraestructura de Google, dijo en una publicación de blog: "Con el aumento de los agentes de IA, creemos que la industria se beneficiará de chips que estén personalizados profesionalmente para las necesidades de capacitación e implementación".
En marzo de este año, Nvidia promocionó su próximo producto de chip, que permitiría a los modelos responder rápidamente a las preguntas de los usuarios con la ayuda de la tecnología adquirida a través de la adquisición de la empresa emergente de chips Groq por 20 mil millones de dólares. Google es un gran cliente de Nvidia, pero también ofrece TPU como alternativa a las empresas que utilizan sus servicios en la nube.
La mayoría de las principales empresas de tecnología del mundo están desarrollando semiconductores específicos de inteligencia artificial para maximizar la eficiencia informática y satisfacer las necesidades de escenarios de aplicaciones específicos. Apple ha estado desarrollando sus propios componentes de IA de motor de red neuronal en chips de iPhone durante muchos años; Microsoft lanzó su chip AI de segunda generación en enero de este año; La semana pasada, Meta anunció que está cooperando con Broadcom para desarrollar una variedad de procesadores de inteligencia artificial.
Google es pionero en esta tendencia. En 2015, Google comenzó a utilizar chips de desarrollo propio para ejecutar modelos de IA y en 2018 abrió el arrendamiento a clientes de servicios en la nube. Amazon Cloud Technology lanzó el chip Inferentia para procesar solicitudes de IA en 2018 y el procesador Trainium para entrenar modelos de IA en 2020.
Los analistas de la institución de inversión DADavidson estimaron en septiembre del año pasado que el valor total del negocio de TPU más el equipo de inteligencia artificial de Google DeepMind era de aproximadamente 900 mil millones de dólares.
En la actualidad, ningún gigante tecnológico puede reemplazar a Nvidia, y Google ni siquiera ha comparado el rendimiento del nuevo chip con los productos del líder en chips de IA. Sin embargo, Google dijo que el rendimiento del nuevo chip de entrenamiento es 2,8 veces mayor que el del Ironwood TPU de séptima generación lanzado en noviembre del año pasado, y el precio es el mismo; el rendimiento del chip de inferencia aumenta en un 80%.
Nvidia dijo que su próximo hardware Groq3LPU utilizará grandes cantidades de memoria estática de acceso aleatorio (SRAM), una tecnología que también utiliza el fabricante de chips de inteligencia artificial Cerebras, que presentó una solicitud de cotización a principios de este mes. El nuevo chip de inferencia de Google, cuyo nombre en código es TPU8i, también está equipado con SRAM. El chip único tiene 384 MB de SRAM incorporado y la capacidad es tres veces mayor que la del Ironwood TPU.
Sundar Pichai, director ejecutivo de Alphabet, la empresa matriz de Google, escribió en un blog que la arquitectura del chip está diseñada para "lograr un rendimiento masivo y una baja latencia de una manera rentable para satisfacer las necesidades de ejecutar millones de agentes simultáneamente".
La escala de aplicaciones de los chips AI de Google se está expandiendo. Google declaró que Citadel Securities ha creado un software de investigación cuantitativa basado en Google TPU, y que los 17 laboratorios nacionales del Departamento de Energía de EE. UU. utilizan software científico colaborativo de IA desarrollado en base a este chip; La empresa de inteligencia artificial Anthropic también se ha comprometido a utilizar varios gigavatios de potencia informática de Google TPU.