Una persona familiarizada con el asunto reveló que OpenAI está finalizando un nuevo modelo con capacidades avanzadas de seguridad de red y planea proporcionarlo sólo a un pequeño número de clientes empresariales, similar al lanzamiento a pequeña escala de Anthropic de su modelo de seguridad de red "Mythos". La razón por la que llama la atención es que muchos expertos en seguridad consideran que la inteligencia artificial ha alcanzado un "punto crítico" en términos de autonomía y capacidades de piratería. Las empresas de desarrollo de modelos están cada vez más preocupadas por el daño que sus propias herramientas pueden causar en la vida real, hasta el punto de que no están dispuestas a "liberarlo" por completo al entorno público.

El martes, Anthropic anunció que su nuevo modelo "Mythos Preview" solo estará abierto a un pequeño número de empresas de tecnología y ciberseguridad cuidadosamente seleccionadas porque el modelo tiene capacidades de intrusión y explotación muy avanzadas, lo que genera preocupaciones sobre posibles abusos. En ese momento, Anthropic fue la primera empresa de inteligencia artificial en adoptar restricciones tan estrictas en su estrategia de lanzamiento de nuevos modelos, y ahora se ha revelado que OpenAI planea tomar un camino similar.

En cuanto a los detalles, OpenAI lanzó un proyecto piloto llamado "Acceso confiable para cibernéticos" en febrero de este año después de lanzar GPT-5.3-Codex, que tiene las capacidades de razonamiento de seguridad de red más sólidas hasta la fecha. Las organizaciones invitadas a unirse al programa cerrado obtendrán acceso a mayores capacidades ciberofensivas y defensivas o a un modelo más "indulgente" para acelerar los esfuerzos de seguridad defensiva legal, según un blog de la compañía. OpenAI también prometió en ese momento que proporcionaría un total de 10 millones de dólares en apoyo de cuota API a los participantes del proyecto para experimentos e implementación relacionados.

El contexto más amplio es que durante el año pasado, varios ex funcionarios gubernamentales y altos líderes de seguridad han estado haciendo sonar la alarma, advirtiendo que si caen en las manos equivocadas, algunos modelos de IA podrían algún día alterar los sistemas de agua, las redes eléctricas e incluso la infraestructura financiera sin intervención humana. Estas capacidades, antes consideradas como "escenarios futuros", ahora están comenzando a tomar forma ante los ojos de los expertos de la industria.

Sin embargo, incluso si las empresas de IA "cierran las compuertas" temporalmente mediante pruebas piloto limitadas y lanzamientos graduales, los principales expertos en seguridad generalmente creen que la tendencia general es difícil de revertir. "No se puede evitar que el modelo realice una enumeración de código o encuentre lagunas en el código base antiguo. Esta capacidad ya existe objetivamente". Señaló Rob T. Lee, director de IA del Instituto SANS. Wendi Whitmore, directora de inteligencia de seguridad de Palo Alto Networks, dijo en una mesa redonda en la conferencia HumanX en San Francisco que tal vez solo queden unas pocas semanas o meses antes de que surja el próximo modelo con capacidades similares y fluya hacia un entorno más abierto. Adam Meyers, vicepresidente senior de contramedidas de CrowdStrike, describió las capacidades demostradas por Mythos como "una llamada de atención para toda la industria".

En opinión de algunos profesionales de la seguridad, si la empresa está realmente preocupada por la capacidad del modelo para "escribir nuevos programas de ataque y explotación" en lugar de simplemente "ayudar a las personas a encontrar vulnerabilidades existentes", entonces sería más "razonable" limitar el alcance del lanzamiento de modelos de vanguardia e implementar el lanzamiento por lotes. Stanislav Fort, director ejecutivo de Aisle Security Company, dijo a Axios que la capacidad de generar automáticamente una nueva cadena de explotación de vulnerabilidades es potencialmente más amenazante para el ecosistema que simplemente descubrir fallas, por lo que debe verificarse lentamente en un entorno controlado.

Algunos expertos también señalaron que el modelo actual a gran escala se abre por etapas, lo que hasta cierto punto es muy similar a la forma en que los proveedores tradicionales de seguridad de red divulgan información sobre vulnerabilidades de software. Lee cree que esto es muy similar al debate sobre la "divulgación responsable de vulnerabilidades" en la industria durante muchos años: cómo equilibrar el momento y el alcance entre la divulgación de riesgos y el suministro de parches es un tema que se discute repetidamente. La diferencia es que lo que se "retrasó en la divulgación" esta vez ya no es una única vulnerabilidad de software, sino una herramienta inteligente general que puede amplificar en gran medida las capacidades de ataque y defensa.

No está claro si OpenAI llevará este próximo modelo de ciberseguridad al mercado de manera más amplia en algún momento en el futuro. Por el contrario, Anthropic ha dejado claro que no lanzará completamente al público el Mythos Preview, pero si en el futuro puede equiparlo con barandillas de seguridad lo suficientemente fuertes, no descarta la posibilidad de considerar una gama más amplia de aperturas para otros modelos de la serie Mythos. Al mismo tiempo, equipos de investigación como Aisle también recordaron que los modelos de IA existentes y ampliamente disponibles en el mercado ya pueden encontrar un número considerable de vulnerabilidades y rutas de explotación en los casos de demostración de Mythos. Esto significa que lo que realmente constituye el "foso" de seguridad son probablemente más los sistemas y procesos construidos alrededor del modelo, que el "volumen" y la "generación" del modelo en sí.