Según una persona familiarizada con el asunto y los documentos revisados ​​por los medios, un pequeño número de usuarios no autorizados han obtenido acceso al modelo Mythos AI de nueva generación de Anthropic PBC. Anthropic ha dicho que la tecnología del modelo es extremadamente poderosa e incluso puede usarse para lanzar peligrosos ataques cibernéticos.

El mismo día que Anthropic anunció por primera vez sus planes de abrir el modelo Mythos a un puñado de empresas para que lo probaran, un puñado de usuarios en un foro privado en línea logró acceder a Mythos, dijeron las personas, que pidieron no ser identificadas por temor a represalias. Desde entonces, el grupo ha estado utilizando Mythos con regularidad, pero no con fines de ciberseguridad, dijeron personas familiarizadas con el asunto. Personas familiarizadas con el asunto también confirmaron la declaración anterior a los medios a través de capturas de pantalla y demostraciones de modelos en vivo.

Anthropic ha dicho anteriormente que Mythos es capaz de identificar y explotar "vulnerabilidades en todos los principales sistemas operativos y en todos los principales navegadores web" según las órdenes del usuario. Por este motivo, la compañía ha asegurado que esta tecnología sólo está disponible para algunos proveedores de software a través de un programa llamado "Glasswing Project" para ayudar a estas empresas a probar y fortalecer sus sistemas para prevenir posibles riesgos de ciberataques.

El acceso no autorizado, que no ha sido revelado previamente, resalta los desafíos que enfrenta Anthropic para evitar por completo que su tecnología más poderosa y potencialmente peligrosa se propague más allá de los socios autorizados. El incidente también plantea más preguntas sobre si otros están usando Mythos sin permiso y cuáles son sus propósitos.

Personas familiarizadas con el asunto dijeron que los usuarios obtuvieron acceso a Mythos a través de una variedad de tácticas, incluido el aprovechamiento de uno de sus privilegios como empleado de un contratista externo de Anthropic y el uso de herramientas de búsqueda de información en Internet comúnmente utilizadas por investigadores de ciberseguridad. Este grupo está activo en un canal privado de Discord y se especializa en recopilar información sobre modelos inéditos y utilizar bots para recopilar detalles relevantes publicados por Anthropic y otras organizaciones en sitios web no protegidos como GitHub.

Un portavoz de Anthropic dijo en un comunicado: "Estamos investigando informes de que alguien obtuvo acceso no autorizado a una versión preliminar de Claude Mythos a través del entorno de uno de nuestros proveedores externos". La compañía agregó que actualmente no hay evidencia de que el acceso mencionado en el informe de Bloomberg se extendiera más allá del entorno de proveedores externos o afectara los propios sistemas de Anthropic.