A medida que las comunidades de todo el mundo se oponen cada vez más al alto consumo de energía y agua de los centros de datos, Nvidia anunció recientemente que su diseño de referencia de centro de datos refrigerado por líquido de nueva generación para la arquitectura Rubin puede reducir significativamente el consumo de agua y mejorar la eficiencia energética general mientras opera a temperaturas más altas. La compañía espera responder a la presión pública en torno a los costos ambientales de los centros de datos de IA, pero también se ha señalado que este plan no aborda controversias más amplias como la selección del sitio, la escala de construcción y los enormes requisitos de energía.
NVIDIA declaró en su blog oficial que este diseño de referencia de centro de datos refrigerado por líquido "casi elimina la dependencia del agua en el proceso de enfriamiento mientras mantiene una alta potencia de cálculo" y lo describió como una solución modelo que vale la pena adoptar cuando los futuros proveedores de servicios en la nube construyan instalaciones de inteligencia artificial de generación Rubin. Sin embargo, los medios tecnológicos señalaron que Nvidia no mencionó la diferencia en los costos de construcción entre las soluciones de refrigeración líquida y los centros de datos tradicionales refrigerados por aire en la publicación del blog, ni dio más detalles sobre la viabilidad económica de este diseño en su implementación real.
A diferencia de las soluciones tradicionales de refrigeración por aire que necesitan mantener una temperatura más baja en la sala de ordenadores, la idea de NVIDIA es permitir que los servidores funcionen a temperaturas más altas y luego cooperar con un sistema de circulación de refrigeración líquida de alta eficiencia para concentrar el calor. Según la compañía, este diseño permite que el servidor de IA funcione de manera estable a temperaturas de hasta 45 grados Celsius (aproximadamente 113 grados Fahrenheit), similar al reciente anuncio de Amazon de que está optimizando los centros de datos refrigerados por aire con límites de disipación de calor más altos. Al aumentar el rango de temperatura tolerable, se espera que los operadores reduzcan su dependencia de fuentes de frío externas en diferentes estaciones y condiciones climáticas.
Nvidia dijo que en esta solución, el calor generado por el servidor es capturado directamente por el componente de refrigeración líquida y transferido al disipador de calor a través de un circuito cerrado de mayor temperatura. Debido a que el circuito de enfriamiento opera a temperaturas más altas, una torre de enfriamiento o un enfriador seco puede eliminar el calor al ambiente la mayor parte del tiempo durante todo el año sin tener que depender de grandes cantidades de agua evaporada, lo que hace que el sistema sea menos sensible a la temperatura del aire ambiente. La empresa destaca que esta arquitectura proporciona una mayor flexibilidad de ingeniería para centros de datos ubicados en diferentes zonas climáticas.

En términos de datos específicos de consumo de agua, Josh Parker, jefe de sostenibilidad de Nvidia, dijo que el diseño de referencia puede reducir el consumo de agua de aproximadamente 0,6 galones por kilovatio hora de carga informática en los sistemas tradicionales de torres de enfriamiento hasta casi cero, logrando una reducción de agua de hasta aproximadamente el 95%. En otras palabras, mientras se mantiene la misma potencia informática, la demanda de agua dulce consumida por los centros de datos para refrigeración se reducirá significativamente, proporcionando espacio de alivio para las instalaciones en áreas con escasez de agua.
A pesar de esto, los observadores de la industria y el medio ambiente señalaron que la declaración de Nvidia se centró más en las mejoras en la tecnología de refrigeración y no proporcionó respuestas sustanciales a algunos de los problemas centrales que más preocupan al mundo exterior, como la huella de carbono de los centros de datos de IA de escala ultragrande durante el proceso de construcción, el enorme consumo de energía requerido para las operaciones a largo plazo y la presión sobre las redes eléctricas locales y el uso del suelo. Enfatizaron que incluso si el agua utilizada en el proceso de enfriamiento es cercana a cero, mientras la demanda de potencia informática continúe aumentando rápidamente, el uso general de energía y recursos se mantendrá en un nivel extremadamente alto.
El informe también menciona que el blog de Nvidia no explica la brecha de inversión en los costos de construcción y modificación de un centro de datos que utiliza un diseño de referencia refrigerado por líquido en comparación con una instalación que utiliza un sistema de refrigeración por aire menos eficiente. Esto significa que para muchos proveedores de servicios en la nube y operadores de hosting, cambiar a la arquitectura de refrigeración líquida defendida por NVIDIA a gran escala no es sólo una elección tecnológica, sino también un juego entre fondos y ciclos de retorno. Algunos analistas creen que sólo bajo la presión conjunta de los precios de la energía, las regulaciones de emisiones y las limitaciones de los recursos hídricos se podrán implementar más ampliamente soluciones eficientes y con un alto nivel de insumos.
A medida que la escala de los modelos de IA y la demanda de inferencia y capacitación continúan aumentando, los proveedores de chips y sistemas como NVIDIA están tratando de influir en la evolución de las formas futuras de los centros de datos a través de diseños de referencia y soluciones integradas. La empresa describe esta arquitectura de centro de datos con refrigeración líquida de alta temperatura como núcleo como una "ruta de migración" para los proveedores de servicios en la nube hacia clústeres de GPU de generación Rubin, con el objetivo de permitirles manejar tareas informáticas más intensivas mientras utilizan menos agua para respaldar las operaciones de infraestructura. Sin embargo, en los debates sociales y políticos más amplios, los requisitos en torno a la transparencia, la participación comunitaria, los límites de consumo de electricidad y la evaluación del impacto ambiental en torno a la selección de la ubicación del centro de datos de IA aún están lejos de verse sustancialmente aliviados por la propuesta de una solución técnica única.