El 14 de marzo, según CNBC, la unidad de procesamiento de gráficos (GPU) de Nvidia ha sido el chip más popular en el mercado durante muchos años, pero el repentino aumento de los agentes de IA ha provocado un renacimiento de su unidad central de procesamiento (CPU) de chip host, más discreta.

La última CPU Vera de Nvidia
Ahora, Nvidia se está preparando para revelar nuevos detalles sobre sus CPU optimizadas para agentes de IA en su conferencia anual GTC, que comienza el lunes, cuando probablemente presentará un bastidor de CPU puro en el stand.
"Las CPU se están convirtiendo en un cuello de botella en la ampliación de la IA y los flujos de trabajo de los agentes", dijo a CNBC esta semana el director de infraestructura de IA de Nvidia, Dion Harris. Cree que se trata de una "oportunidad apasionante".
Nvidia lanzó su primera CPU para centro de datos, Grace, en 2021, y su producto de próxima generación, Vera, ya está en producción. Estas CPU a menudo se implementan en sistemas completos a escala de rack junto con las famosas GPU Hopper, Blackwell o Rubin de Nvidia.
El aumento de la demanda de GPU ha convertido a Nvidia en un nombre muy conocido y en la empresa pública más valiosa del mundo, con una capitalización de mercado de 4,4 billones de dólares. En febrero de este año, la estrategia general de chips de Nvidia experimentó un cambio importante. En ese momento, Nvidia llegó a un acuerdo de varios años con Meta que incluía la primera implementación independiente a gran escala de CPU Grace, con planes de implementar Vera en 2027.
Miles de CPU Nvidia individuales también están alimentando supercomputadoras en el Centro de Computación Avanzada de Texas y el Laboratorio Nacional de Los Álamos, dijo Nvidia a CNBC.
Los agentes inteligentes impulsan el renacimiento de la CPU
Bank of America predice que el tamaño del mercado de CPU puede más que duplicarse, de 27 mil millones de dólares en 2025 a 60 mil millones de dólares en 2030. Sólo en el último trimestre, Nvidia generó más de 62 mil millones de dólares en ingresos por centros de datos, un aumento interanual del 75%.
El renacimiento de la CPU se debe a cambios fundamentales en los requisitos informáticos: con la popularización a gran escala de la IA, los escenarios de aplicación han pasado gradualmente de robots de chat de preguntas y respuestas a aplicaciones de agentes orientadas a tareas.
Si bien las GPU son excelentes para entrenar y ejecutar modelos de IA porque tienen miles de núcleos pequeños enfocados en realizar una gran cantidad de operaciones simultáneamente, las CPU tienen una cantidad menor de núcleos de alto rendimiento que pueden ejecutar tareas continuas de propósito general.
Los agentes de IA requieren una gran cantidad de potencia informática de uso general porque necesitan transmitir y procesar grandes cantidades de datos en flujos de trabajo de IA, así como colaborar y programar entre múltiples agentes.

Jen Hsun Huang
El CEO de Nvidia, Jensen Huang, dijo en una conferencia telefónica sobre ganancias el mes pasado: "Estos sistemas de agentes están generando diferentes agentes que trabajan juntos como un equipo. La cantidad de tokens generados ha aumentado exponencialmente, por lo que necesitamos realizar inferencias a mayor velocidad".
Huang Renxun mencionó a los agentes de IA muchas veces durante la conferencia telefónica y dijo: "A medida que cambian los requisitos de hardware, lo más importante es el rendimiento por vatio".
Nvidia dijo en un comunicado de prensa que sus CPU discretas han mejorado significativamente el rendimiento por vatio en los centros de datos de Meta. Ben Bajarin, analista de chips de Creative Strategies, dijo: "Esta es una infraestructura completamente nueva: una nueva expansión de bastidores de CPU puros que solo son responsables de ejecutar agentes de IA. Su software estará ubicado en otro lugar y sus aceleradores solo serán responsables de procesar tokens, pero debe haber una capa intermedia responsable de coordinar la programación".
Crisis de suministro de CPU
Hoy en día, el alguna vez tranquilo mercado de CPU se enfrenta a lo que la consultora The Futurum Group llama una "crisis de suministro silenciosa". La agencia predice que para 2028, la tasa de crecimiento del mercado de CPU puede superar a la de las GPU.
Según Reuters, los principales proveedores de CPU, AMD e Intel, han emitido advertencias de escasez de suministro a los clientes chinos. Según los informes, el ciclo de entrega de la CPU es de hasta seis meses y el precio ha aumentado más del 10%.
"Hemos visto un aumento sin precedentes en la demanda en los últimos seis a nueve meses", dijo a CNBC el director del centro de datos de AMD, Forrest Norrod, en una entrevista.
Norod cree que la demanda de CPU no se ralentizará ni dejará de crecer a corto plazo, pero AMD ha previsto el aumento de la demanda y está "intensificando sus esfuerzos" para satisfacerla.
Un portavoz de Intel dijo a CNBC que la compañía espera que los inventarios alcancen un "punto bajo" este trimestre, "pero estamos respondiendo de manera proactiva y esperamos que la oferta mejore gradualmente desde el segundo trimestre hasta finales de 2026".
Bayarin, analista de chips de Creative Strategies, dijo: "Las obleas no crecen por sí solas. No podemos cosechar un 10% más de obleas de silicio de la nada. Toda la industria se enfrenta a limitaciones de suministro. Así que, lamentablemente, el suministro de obleas de CPU es limitado".
Cuando se le preguntó si Nvidia experimentaría retrasos en el envío de CPU, Harris, director de infraestructura de inteligencia artificial de Nvidia, dijo a CNBC que "todo es normal en este momento".
Dijo que Nvidia tiene una "cadena de suministro sólida" que puede manejar las presiones de la demanda, gracias en gran parte al hecho de que la compañía vende muchas de sus CPU junto con GPU en sistemas a escala de rack.
Optimizado para GPU
Harris dijo que Nvidia ha adoptado un enfoque de diseño fundamentalmente diferente, haciendo que sus CPU sean "más adecuadas" para el procesamiento de datos y los flujos de trabajo de agentes de IA en comparación con las CPU de uso más general producidas por Intel y AMD.
Una de las principales diferencias es la cantidad de núcleos por CPU. Las CPU de servidor de alto rendimiento Intel Xeon y la serie EPYC de AMD suelen tener 128 núcleos, mientras que las CPU Grace de Nvidia tienen 72 núcleos.

CPU de servidor AMD serie EPYC
"Si usted es una empresa de nube a hiperescala, desea maximizar la cantidad de núcleos por CPU, esencialmente para reducir el costo, el costo por núcleo", explicó Harris. "Así que es un modelo de negocio".
Sin embargo, Nvidia diseñó sus CPU específicamente para ayudar a su producto estrella, GPU, a ejecutar cargas de trabajo de IA. "En este caso, el rendimiento de un solo subproceso es más importante que el costo por núcleo porque desea asegurarse de que ese recurso extremadamente costoso, la GPU, no esté esperando inactivo", dijo Harris.
Las CPU de Nvidia también se basan en la arquitectura ARM, que se usa más comúnmente en chips para dispositivos de bajo consumo como teléfonos inteligentes, mientras que las CPU de Intel y AMD se basan en la arquitectura tradicional x86. Introducido por Intel hace casi 50 años, x86 ha dominado el diseño de procesadores de servidores y PC desde sus inicios.
"Creo que Nvidia ha optimizado muy bien sus chips para proporcionar potencia informática a las GPU, pero no están muy bien optimizados para aplicaciones de propósito general", dijo Norod, director de centros de datos de AMD.
De hecho, Nvidia depende de CPU de uso más general para algunos productos. Por ejemplo, en la plataforma HGX Rubin NVL8, Nvidia combina sus propias GPU con CPU host de Intel o AMD para que los clientes las utilicen como componentes básicos para construir sus propios bastidores de IA.
A medida que Nvidia ingresa al mercado de CPU independientes, cada vez más clientes desarrollan procesadores basados en la arquitectura ARM para sus propios centros de datos.
Amazon fue la primera gran empresa de servicios en la nube a hiperescala en lanzar una CPU de desarrollo propio y lanzó el procesador Graviton en 2018. Futurum Group dijo que el procesador Axion de Google, lanzado en 2024, ahora maneja alrededor del 30% de las aplicaciones internas. Microsoft lanzó su procesador Cobalt de segunda generación en noviembre del año pasado. Se espera que ARM lance su CPU de desarrollo propio este año y Meta se convertirá en su primer cliente.
La firma de investigación Mercury Research estima que en el cuarto trimestre de 2025, la cuota de mercado de CPU para servidores estará dominada por Intel, con el 60%, AMD con el 24,3% y Nvidia con el 6,2%. Las acciones restantes están ocupadas por CPU de desarrollo propio basadas en la arquitectura ARM de empresas de computación en la nube de gran escala como Amazon, Microsoft y Google.