La era Vera Rubin de la plataforma informática de IA de nueva generación de NVIDIA ha comenzado oficialmente. Se la conoce como la plataforma de inteligencia artificial más rápida del mundo. Se ha entregado a varios de los principales proveedores de servicios en la nube para su prueba y verificación, allanando el camino para la siguiente etapa de implementación de capacitación en IA agente y de modelos grandes.

Según los informes, la plataforma Vera Rubin ha entrado en la etapa de producción en masa y el primer lote de sistemas completos se ha entregado a las salas de informática de los principales proveedores de nube de IA, incluidas empresas como Oracle y CoreWeave. Antes de esto, NVIDIA había entregado el primer lote de CPU Vera a varias empresas líderes en inteligencia artificial el mes pasado, sentando las bases para la ecología de esta nueva plataforma.
Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure, publicó por primera vez fotografías físicas del sistema de rack Vera Rubin NVL72 en plataformas sociales, mostrando este enorme clúster de rack compuesto por 72 GPU Rubin y 36 CPU Vera. Posicionándola oficialmente como la mejor combinación actual de GPU y CPU para cargas de trabajo de IA, su objetivo es convertirse en otra plataforma histórica en la línea de productos de IA de Nvidia después de Grace Blackwell.


Thiagarajan dijo que Oracle es uno de los primeros proveedores de la nube en introducir el sistema Vera Rubin NVL72 en la nube y realizar pruebas de verificación. Las dos partes trabajarán estrechamente para ofrecer a los clientes empresariales una nueva generación de capacidades informáticas aceleradas en entornos de nube a gran escala. A juzgar por las imágenes del sitio, el gabinete NVL72 es de gran tamaño y tiene estructuras complejas de cableado y enfriamiento, lo que resalta su orientación de diseño para centros de datos de gran escala.
Además de Oracle, la empresa de computación en la nube CoreWeave también anunció la finalización de la instalación del primer sistema Vera Rubin NVL72 y publicó un video completo de la descarga de toda la máquina desde el vehículo de transporte a la sala de computadoras para su implementación. La pantalla muestra que la instalación de un solo gabinete requiere la operación colaborativa de 3 a 4 ingenieros. Esto refleja en cierta medida las especificaciones del sistema "a nivel de centro de datos" en términos de volumen y peso. También implica que es posible que en el futuro se implementen cientos o incluso miles de gabinetes similares en los centros de datos de IA.
CoreWeave también enfatizó que no solo fue uno de los primeros proveedores de servicios en la nube en presentar Vera Rubin NVL72, sino también el primero en completar la depuración y verificación conjunta de la pila completa de software y hardware. Para este propósito, la compañía ha creado su propio sistema de refrigeración líquida definido por software y soluciones de control de gabinete unificado, llamados Valvey y Racky respectivamente, que se utilizan para la gestión de refrigeración líquida y la programación unificada de toda la plataforma Vera Rubin del gabinete, y a través de "CoreWeave Mission Control" para lograr el monitoreo operativo a nivel del grupo de gabinetes.
En la visión arquitectónica de "La IA es un pastel de cinco capas" propuesta por el CEO de NVIDIA, Jensen Huang, Vera Rubin NVL72 es solo una capa de hardware. Detrás de esto, también depende de una infraestructura sofisticada que incluye suministro de energía, refrigeración, interconexión, red, etc., así como un soporte de pila de software construido a lo largo de muchos años. Con CUDA y el ecosistema CUDA-X para cargas de trabajo de IA como núcleo, NVIDIA integra software y hardware, lo que dificulta que los fabricantes competidores compitan frontalmente en términos de madurez ecológica y adopción generalizada.
En términos de rendimiento, los informes indican que en el escenario de entrenamiento del modelo Mix of Experts (MoE), la plataforma Vera Rubin puede alcanzar la misma velocidad de entrenamiento que el sistema Blackwell de la generación anterior utilizando solo una cuarta parte de la cantidad de GPU, mientras que el costo por Token en la etapa de inferencia se puede reducir a una décima parte de Blackwell. Esto significa que al implementar modelos a gran escala e IA agente a nivel de fábrica, se espera que Vera Rubin aporte ventajas significativas en densidad de potencia informática y eficiencia energética, brindando soporte clave para que los proveedores de la nube controlen los costos y amplíen la escala.
Actualmente, la plataforma Vera Rubin ha entrado en plena producción en masa y NVIDIA planea lanzar oficialmente el primer lote de tareas de ejecución de producción orientadas al cliente en el tercer trimestre de este año. Con los principales proveedores de servicios en la nube, como Oracle y CoreWeave, tomando la iniciativa para completar el lanzamiento y la verificación, la industria en general espera que Vera Rubin pronto se convierta en uno de los componentes centrales de la nueva generación de infraestructura de centros de datos de IA, promoviendo la implementación de "fábricas de IA agente" y aplicaciones de modelos grandes más complejas.