Amazon presentó el lunes NovaAct, un agente de inteligencia artificial de uso general que puede controlar un navegador web y realizar algunas acciones simples de forma independiente. Además del nuevo modelo de IA de agente, Amazon también lanzó NovaActSDK, un conjunto de herramientas que permite a los desarrolladores crear prototipos de agentes utilizando NovaAct.

Desarrollado en los recién inaugurados AGI Labs de Amazon en San Francisco, NovaAct también proporcionará una funcionalidad clave para la próxima actualización de la compañía a Alexa+, una mejora generativa de IA para el popular asistente de voz de Amazon. Sin embargo, la versión de NovaAct disponible a partir de hoy es ligeramente inferior. Amazon lo llama un avance de la investigación.

Los desarrolladores pueden acceder al kit de herramientas NovaAct a través del nuevo sitio web nova.amazon.com, que también sirve como escaparate para los diversos modelos básicos de Nova de Amazon.

NovaAct es el intento de Amazon de aprovechar su propia tecnología de agente de inteligencia artificial general para competir con Operador de OpenAI y ComputerUse de Anthropic. Varias empresas tecnológicas líderes creen que los agentes de IA capaces de navegar por la web para los usuarios harán que los chatbots de IA de hoy sean más útiles.

Puede que Amazon no sea el primero en desarrollar este tipo de tecnología de agente, pero con Alexa+, su alcance puede ser el más amplio.

Amazon dice que los desarrolladores que construyen con el SDK NovaAct deberían poder automatizar acciones básicas en nombre de los usuarios, como pedir una ensalada a Sweetgreen o hacer una reserva para cenar. Con el kit de herramientas NovaAct, los desarrolladores pueden integrar herramientas que permiten a los agentes de IA navegar por la web, completar formularios o seleccionar fechas en un calendario.

Amazon afirma que NovaAct superó a OpenAI y a los agentes de Anthropic en varias pruebas dentro de la empresa. Por ejemplo, en ScreenSpot WebText, que mide cómo un agente de IA interactúa con el texto en la pantalla, NovaAct obtuvo una puntuación del 94%, mejor que CUA de OpenAI (con una puntuación del 88%) y Claude3.7Sonnet de Anthropic (90%).

Sin embargo, Amazon no comparó NovaAct utilizando evaluaciones de proxy más comunes como WebVoyager.

NovaAct es el primer producto público lanzado por el laboratorio AGI de Amazon antes mencionado. El proyecto está codirigido por los ex investigadores de OpenAI David Luan y Pieter Abbeel. Ambos fundaron anteriormente sus propias empresas emergentes (Luan fundó Adept, mientras que Abbeel cofundó Covariant) y Amazon los contrató el año pasado para liderar sus esfuerzos de agentes de IA.

Si bien puede parecer extraño que AGI Labs desarrolle un agente de IA capaz de ordenar SweetGreen, Luan cree que los agentes son un paso crítico en la creación de sistemas de IA súper inteligentes. Luan define AGI como "un sistema de inteligencia artificial que puede ayudarte a hacer todo lo que hace un humano en una computadora".

Luan dijo que su equipo diseñó NovaActSDK para automatizar de manera confiable tareas cortas y brindar a los desarrolladores herramientas que les permitan definir con precisión cuándo se necesita la intervención humana en los flujos de trabajo de los agentes. Espera que esto permita a los desarrolladores crear aplicaciones proxy más confiables, aunque no necesariamente completamente autónomas.

Amazon ha lanzado su primer agente de inteligencia artificial general en un mercado abarrotado, pero es una tecnología clave en la que la empresa tiene grandes esperanzas. Las primeras pruebas de NovaAct ofrecen un vistazo a algunas de las capacidades de Alexa+, largamente retrasada, lo que marca un momento decisivo para los esfuerzos de inteligencia artificial de Amazon.

El principal problema de los primeros agentes de IA de OpenAI, Google y Anthropic es su confiabilidad en diferentes dominios. En las pruebas de TechCrunch, estos sistemas eran lentos, difíciles de ejecutar de forma independiente durante largos períodos de tiempo y propensos a cometer errores que los humanos no cometerían. Pronto veremos si Amazon ha descifrado el código... o si sus agentes padecen los mismos defectos que han afectado a sus competidores.