En una nueva ola de inteligencia artificial representada por la "IA agente", la Arquitectura de Memoria Unificada (UMA) se está calentando rápidamente en los campos de las PC y la informática. AMD cree que esta no sólo es una oportunidad importante, sino también una dirección clave para la futura arquitectura y hoja de ruta de productos.

La llamada arquitectura de memoria unificada se refiere a acoplar estrechamente la CPU, la GPU y la memoria en el mismo chip del sistema (SoC) para formar un gran grupo de memoria compartido, que el sistema asigna dinámicamente entre la CPU y la GPU según la carga, en lugar del modelo de separación tradicional "memoria del sistema + memoria de video independiente". En las cargas de trabajo de IA, especialmente en la inferencia de modelos grandes, este diseño puede reducir significativamente los cuellos de botella en la copia de datos y el ancho de banda, por lo que gradualmente se está convirtiendo en una de las soluciones principales para terminales de IA y nuevas formas de PC.
Con el lanzamiento de la serie AMD Ryzen AI MAX y la incorporación de NVIDIA RTX Spark y otros productos, la arquitectura de memoria unificada se ha convertido en la piedra angular técnica común de las plataformas de terminales de IA. AMD dijo que su solución Ryzen AI MAX de primera generación puede proporcionar hasta 128 GB de memoria, de los cuales hasta 112 GB de memoria del sistema se pueden dividir para la GPU; NVIDIA RTX Spark también utiliza una idea similar para asignar dinámicamente memoria entre la CPU y la GPU en función de la carga de trabajo, lo que permite que la arquitectura de memoria unificada cubra una amplia gama de escenarios de aplicaciones, desde informática general hasta inferencia de IA.
En una entrevista con los medios, se le preguntó al vicepresidente de AMD, David McAfee, si más productos utilizarán soluciones UMA en el futuro. Respondió que el enfoque en los sistemas de memoria unificada seguirá aumentando y que la industria explorará "formas arquitectónicas apropiadas" en torno a dichos sistemas y continuará iterando y mejorando en función de las plataformas existentes. Enfatizó que este es un nuevo tipo de carga de trabajo y espacio informático que abrirá "todo un mundo de posibilidades" para AMD en la selección de productos, planificación de rutas y formas de implementación.
AMD ha ampliado su pensamiento de memoria unificada a sus productos de próxima generación, la serie Ryzen AI MAX 400. Según la introducción oficial, esta generación de productos puede admitir hasta 192 GB de memoria unificada y puede asignar hasta 160 GB a la GPU, que se puede utilizar para ejecutar localmente modelos de lenguaje grande (LLM) con una escala de parámetros de más de 300 mil millones de niveles para satisfacer las demandas extremas de capacidad de memoria y ancho de banda de flujos de trabajo complejos de IA y cargas de trabajo creativas de alto nivel.

En la mesa redonda de medios, un periodista preguntó además si es posible ver procesadores UMA Ryzen para juegos en el futuro, o un diseño similar a "Strix Halo + 3D V-Cache / memoria de alto ancho de banda a nivel de paquete" para mejorar aún más las capacidades de UMA a través de una integración más estrecha y memoria empaquetada de menor latencia. McAfee dijo que actualmente "no tiene una respuesta específica", pero reiteró que plataformas como Strix Halo están entrando en el mismo camino que Nvidia, lo que significa que el diseño de sistemas en torno a UMA recibirá más inversión en recursos y exploración arquitectónica en los próximos años.
Vale la pena señalar que cuando McAfee habló de UMA, no solo mencionó terminales móviles y de inteligencia artificial, sino también sistemas de escritorio de alto rendimiento. Él cree que la mejora continua de las capacidades de soporte de la arquitectura de memoria unificada y la adopción de esta arquitectura por parte de participantes más ecológicos promoverán la evolución general de las computadoras de escritorio de alto rendimiento y las formas de sistemas unificados, y remodelarán la comprensión de la industria sobre "PC de alto rendimiento + memoria unificada". En su opinión, la arquitectura unificada adoptada por plataformas como Halo sigue siendo la "forma correcta" de este tipo de sistema, y los recientes lanzamientos relacionados de Nvidia pueden considerarse como un "respaldo" de este camino arquitectónico.
McAfee también destacó que con el auge de Agentic Compute, ejecutar "modelos muy grandes" en endpoints a través de un grupo de memoria unificado se convierte en una de las propuestas de valor únicas de estos sistemas. Para AMD, este tipo de sistema unificado desempeña un doble papel en la cartera general de productos: por un lado, admite IA de vanguardia y grandes cargas de trabajo de modelos y, por otro lado, también puede convertirse en la plataforma básica para computadoras de escritorio de alto rendimiento y estaciones de trabajo creativas avanzadas.
Desde la perspectiva de la industria, la arquitectura de memoria unificada ya no es un experimento de nicho, sino que ha evolucionado rápidamente hasta convertirse en un pilar básico en las plataformas informáticas de nueva generación. A medida que la demanda de Agentic AI de grupos de memoria compartida de gran capacidad continúa aumentando, fabricantes como AMD y NVIDIA han apostado conjuntamente por UMA, lo que también significa que esta ruta arquitectónica ha recibido un fuerte respaldo a nivel de la industria. La planificación activa de AMD para nuevas plataformas como Ryzen AI MAX 400 y su actitud abierta hacia la forma futura de plataformas de alto rendimiento como Strix Halo muestran que todavía es sólo el punto de partida para el desarrollo de una arquitectura de memoria unificada.
En un sistema unificado donde los límites entre CPU, GPU y memoria se difuminan gradualmente, se espera que la plataforma de nueva generación logre saltos simultáneos en rendimiento, eficiencia energética y límites de capacidad. Esto no sólo es aplicable a la IA y a cargas de trabajo de modelos grandes, sino que también puede extenderse a juegos y campos de escritorio de alta gama. Para AMD, la arquitectura de memoria unificada se está convirtiendo en una de las bases centrales en el diseño de la arquitectura de su producto de próxima generación y en la planificación del camino a mediano y largo plazo, y todo el ecosistema acaba de entrar en la etapa inicial de este camino.