La GPU Feynman de próxima generación de NVIDIA está a punto de debutar: el primer proceso de 1,6 nm, consumo de energía de más de 1000W

NVIDIA celebrará la conferencia GTC de este año la próxima semana del 16 al 19 de marzo. Se espera que lance al menos dos productos de gran éxito, uno es una LPU sesgada hacia el razonamiento y el otro es la arquitectura de GPU de próxima generación Feynman. Feynman (el físico Feynman) todavía utiliza el sistema anterior que lleva el nombre del famoso científico. De hecho, su existencia se mencionó en la hoja de ruta del año pasado, pero había muy poca información. Solo mencionó la noticia de combinar la memoria HBM de próxima generación.

Según las últimas noticias, la tarjeta gráfica Feynman se lanzará con el proceso A16 de TSMC.Este es el primer proceso de nivel de 1,6 nm del mundo y el primer proceso de TSMC que utiliza la fuente de alimentación trasera SRP., esta tecnología no solo puede mejorar la densidad y el rendimiento, sino también mejorar la capacidad de suministro de energía, principalmente para la informática de alto rendimiento HPC.

Sin embargo, el proceso OEM A16 es caro. Se ha informado que NVIDIA planea transferir algunos pedidos de empaques a Intel y utilizar la tecnología de empaque EMIB-T de este último en lugar de depender completamente del empaque CoWoS de TSMC para reducir costos y aumentar la capacidad de producción.

Las tarjetas gráficas Feynman llevarán el rendimiento de la IA a nuevas alturas, pero también traerán muchos problemas. El primero es el consumo de energía. La arquitectura Blackwell actual se acerca a los 1000 W y el consumo de energía del Blackwell Ultra de doble ingreso alcanza incluso los 1400 W.Feynman también alcanzará más de 1000W, y es posible que las tarjetas de doble núcleo tengan que alcanzar los 2000W.

El aumento en el consumo de energía naturalmente conducirá a un mejor rendimiento, pero también habrá problemas de disipación de calor. Vera Rubin ha dejado claro que toda la refrigeración líquida se utilizará para la disipación de calor, y Feynman también debería recurrir a una refrigeración líquida más eficiente.

Otro cambio es que Feynman integrará la tecnología LPU de Groq, pero personalmente creo que no es necesariamente así. La razón principal es que la arquitectura Feynman debería haber completado el diseño, y toda la LPU es demasiado tarde, y NVIDIA obviamente incorporará la LPU a una línea de productos independiente. Después de todo, los requisitos para los chips de IA en escenarios de entrenamiento e inferencia son diferentes y deben tratarse por separado.

Para los jugadores, las tarjetas gráficas Feynman estarán muy lejos por muy buenas que sean, porque Feynman es para 2028.Las tarjetas de juego aún se actualizarán a la arquitectura Rubin en la segunda mitad del próximo año, y las tarjetas de juego Feynman no estarán disponibles hasta al menos 2029.