Microsoft anunció recientemente que su primer lote de chips de IA de desarrollo propio, "Maia 200", se ha puesto oficialmente en uso en un centro de datos y planea expandir aún más su implementación global en los próximos meses. Microsoft posiciona este chip como un "motor de potencia de razonamiento de IA" para escenarios de razonamiento y está optimizado principalmente para cargas de trabajo de nivel de producción de alta intensidad, como el razonamiento en línea de modelos grandes. Los indicadores de rendimiento publicados por Microsoft muestran que Maia 200 puede superar al último chip Trainium de Amazon y al TPU de última generación de Google en términos de velocidad de procesamiento. Su objetivo es aprovechar la ventaja tecnológica en la competencia por los chips de aceleración de IA de desarrollo propio por parte de los fabricantes de la nube.

Un trasfondo importante para los chips de IA de desarrollo propio del gigante de la computación en la nube es el alto costo actual y la escasa oferta de las últimas GPU de alta gama de fabricantes como Nvidia. Este cuello de botella en el suministro seguirá siendo difícil de aliviar en el corto plazo. Sin embargo, incluso si tiene chips de IA de alto rendimiento de desarrollo propio, Microsoft no dejará de comprar chips de Nvidia y AMD. El director ejecutivo de Microsoft, Satya Nadella, dijo que la compañía mantiene una "gran asociación" con Nvidia y AMD, y ambas partes continúan promoviendo la innovación en sus respectivos campos. En su opinión, la opinión del mercado suele interesarse por comparar "quién va por delante", pero la verdadera clave es mantener la ventaja durante un largo período de tiempo.
Nadella también enfatizó que Microsoft tiene la capacidad de integrarse verticalmente, pero esto no significa que la empresa solo utilizará su propia tecnología de arriba a abajo y abandonará por completo las soluciones de los socios ecológicos. En otras palabras, además de los chips de desarrollo propio, Microsoft seguirá dependiendo de una cartera de hardware diversificada de proveedores como Nvidia y AMD para respaldar sus necesidades de computación en la nube de IA en rápido crecimiento.
Según el acuerdo de Microsoft, Maia 200 tendrá prioridad para el equipo interno de "Superinteligencia" de la empresa. El equipo, dirigido por el ex cofundador de Google DeepMind, Mustafa Suleiman, es responsable de construir una nueva generación de modelos grandes de vanguardia para Microsoft. En general, se cree que la inversión de Microsoft en la construcción de sus propios modelos de vanguardia tiene como objetivo reducir en cierta medida su dependencia de proveedores de modelos externos, como OpenAI y Anthropic, hasta cierto punto en el futuro. Suleiman publicó en la plataforma social.
Al mismo tiempo, Maia 200 también admitirá modelos OpenAI que se ejecutan en la plataforma en la nube Microsoft Azure, brindando a los clientes de la nube más opciones de potencia informática de IA. Sin embargo, los comentarios de todas las partes muestran que obtener los recursos de hardware de IA más avanzados sigue siendo un problema común al que se enfrenta toda la industria. Esta tensa situación no sólo afecta a los clientes que pagan, sino que también afecta a los equipos internos de I+D de IA de los proveedores de la nube. En tal entorno de suministro, Microsoft está acelerando la implementación de chips de aceleración de IA de desarrollo propio, por un lado, y por otro, continúa aumentando las compras de NVIDIA y AMD para garantizar las necesidades duales de su infraestructura de IA en términos de expansión de escala y optimización del rendimiento.