Microsoft relaja las restricciones locales de IA y las PC con tarjeta gráfica de la serie RTX 30 también pueden ejecutar el idioma Windows 11 model

Microsoft actualizó recientemente de manera discreta el documento indicando que siempre que el dispositivo esté equipado con una tarjeta gráfica discreta que cumpla con las condiciones, incluso si no es una PC Copilot+, puede ejecutar la API del modelo de idioma local en Windows 11. Esto se considera un paso importante para debilitar la ventaja exclusiva de la PC Copilot+. Según las últimas instrucciones, el hardware elegible incluye NVIDIA GeForce RTX serie 30 y modelos más nuevos, y requiere 6 GB de memoria de video o más.

Esto significa que algunas PC de alto rendimiento que originalmente no cumplen con el estándar de PC Copilot+ podrán obtener capacidades de IA local a nivel de sistema a través de GPU, en lugar de depender completamente de nuevos modelos con NPU de alta potencia informática.

Copilot+ PC se presentó oficialmente el 18 de junio de 2024. Microsoft lo presentó como la “única forma” de ejecutar IA local en ese momento y lo utilizó como un importante punto de venta para promover las actualizaciones de PC. Según la definición original de Microsoft, para que un dispositivo sea etiquetado como PC Copilot+, debe estar equipado con al menos 16 GB de memoria, una unidad de estado sólido y una NPU (unidad de procesamiento neuronal) que pueda proporcionar no menos de 40 TOPS de potencia informática. La NPU está diseñada para ejecutar modelos de IA de manera eficiente, enfatizando la eficiencia energética, mientras que la GPU es buena en computación paralela a gran escala y tiene una potencia de computación bruta más fuerte. Sin embargo, bajo la estrategia anterior, Microsoft limitó las funciones locales de IA, como Windows Recall y "Click to Do" a las PC Copilot+ equipadas con NPU, lo que resultó en que muchas computadoras con GPU con un rendimiento de hardware igualmente potente no pudieran usar estas capacidades de IA integradas.

Este giro proviene de una nota de actualización de Microsoft en GitHub. Microsoft confirmó en el documento que la API del modelo de lenguaje ya se puede ejecutar en GPU en PC que no sean Copilot+, siempre que se cumplan dos condiciones: primero, tener una tarjeta gráfica de la serie RTX 30 o más nueva, y segundo, la tarjeta gráfica tiene al menos 6 GB de memoria de video. "La API del modelo de lenguaje ahora se ejecuta en PC que no son Copilot+ con GPU compatibles, lo que lleva las capacidades del modelo de lenguaje nativo a una gama más amplia de dispositivos con Windows 11", dijo Microsoft en la nota. El hardware compatible actualmente incluye la serie NVIDIA GeForce RTX 30 y líneas de productos posteriores, y requiere 6 GB de memoria de video o más. En términos prácticos, este cambio amplía el alcance de los modelos en idiomas locales desde las nuevas PC Copilot+ a la gran cantidad de dispositivos con Windows 11 de alto rendimiento que ya están en uso.

Desde la perspectiva del desarrollador, la API del modelo de lenguaje proporciona un conjunto de interfaces Windows.AI.Text que se pueden llamar localmente, respaldadas por un pequeño modelo de lenguaje llamado "Phi Silica". El modelo apareció anteriormente en productos como Microsoft Edge, para funciones como "Reescribir usando IA". Según la configuración de Microsoft, las PC normales con Windows actualmente no preinstalan modelos de IA locales de forma predeterminada. Sólo los usuarios que compren PC Copilot+ tendrán contenido relevante preestablecido en el sistema. Según el nuevo esquema, si un usuario ejecuta una aplicación que admite la API del modelo de idioma local, el sistema puede descargar el modelo Phi Silica a través de Windows Update y ejecutarlo localmente en una GPU calificada.

Según las capacidades de interfaz anunciadas actualmente, las funciones de IA locales que los desarrolladores pueden llamar en sus aplicaciones incluyen: formato de texto inteligente usando la interfaz Windows.AI.Text, resumen de texto (TextSummarizer), reescritura (TextRewriter), texto a tabla (TextToTableConverter) y generación de palabras de aviso general, etc. En otras palabras, siempre que el hardware cumpla con los estándares, los usuarios podrán obtener una experiencia de procesamiento de texto parcial similar a ChatGPT de forma nativa en aplicaciones de Windows, y el proceso de cálculo se completa completamente localmente, lo que tiene más ventajas. en protección de la privacidad que Copilot o ChatGPT que dependen de modelos en la nube.

Cabe señalar que actualmente Microsoft solo liberaliza el alcance de la aplicación GPU en el nivel API del modelo de lenguaje. A juzgar por la información disponible, algunas funciones de IA en aplicaciones como Windows Recall, "Click to Do" y MS Paint todavía solo están disponibles para las PC Copilot+ con NPU integradas. En otras palabras, este ajuste tiene más que ver con "desbloquear" una gama más amplia de plataformas de hardware para capacidades locales de IA, como texto e indicaciones, en lugar de eliminar por completo el umbral para las NPU en el ecosistema Copilot+. Sin embargo, a medida que las capacidades locales de IA se extienden gradualmente a las tradicionales PC con GPU de alto rendimiento, el punto de venta de Copilot+ PC como "el único que puede ejecutar IA localmente" se ha debilitado significativamente, lo que también ha llevado a especulaciones externas sobre si Microsoft relajará aún más o incluso cancelará los requisitos obligatorios para las NPU en el futuro.