Los investigadores de seguridad revelaron recientemente que utilizaron el modelo de inteligencia artificial de nueva generación Mythos de Anthropic para descubrir un nuevo método de derivación de seguridad en el sistema macOS de Apple, rompiendo con éxito la tecnología de protección de seguridad de la memoria que Apple se ha centrado en desarrollar en los últimos años. Este descubrimiento es considerado por la industria como un desafío importante a la imagen de Apple de "el sistema de escritorio más difícil de acceder del mundo".

Calif, una empresa de seguridad de Palo Alto, California, dijo que cuando su equipo probó una versión inicial de Mythos en abril de este año, basándose en las pistas proporcionadas por el modelo, descubrió y combinó dos vulnerabilidades independientes, complementadas con una serie de técnicas de ataque, para finalmente destruir la memoria del dispositivo Mac y obtener áreas del sistema a las que no se debería acceder. Este tipo de ataque se clasifica como un "exploit de escalada de privilegios" y, si se combina con otras cadenas de ataques, tiene el potencial de otorgar a los piratas informáticos un control total sobre la computadora objetivo.

Muchos expertos en seguridad señalaron que esta tecnología es de gran importancia porque Apple ha invertido mucho en bloquear la superficie de ataque de macOS y es conocida desde hace mucho tiempo por su sólida seguridad. Después de revisar la investigación de Calif, Michał Zalewski, un investigador de seguridad que alguna vez trabajó en Google, dijo que en el contexto del continuo fortalecimiento de la protección de la plataforma por parte de Apple, dicha cadena de vulnerabilidades es particularmente llamativa y muestra la doble evolución de las técnicas y herramientas de los atacantes.

Apple dijo que estaba revisando el informe técnico presentado por Calif para verificar los hallazgos y enfatizó que "la seguridad es nuestra principal prioridad y tomamos muy en serio cualquier informe de vulnerabilidades potenciales". En los últimos años, Apple también ha implementado y probado internamente modelos de vanguardia a gran escala para descubrir y parchear automáticamente las vulnerabilidades del sistema, tratando de mantenerse proactivo en esta nueva ronda de competencia ofensiva y defensiva impulsada por la IA.

En los últimos meses, la capacidad de los grandes modelos para extraer defectos de software ha aumentado drásticamente, lo que ha generado preocupación en la comunidad de ciberseguridad sobre un "Bugmageddon": se descubrirán de forma concentrada vulnerabilidades de seguridad de una magnitud sin precedentes, lo que no sólo ejercerá una enorme presión sobre los equipos técnicos responsables de parchear, sino que también amplificará los riesgos de ciberseguridad a corto plazo. A principios de este año, otro modelo Anthropic encontró más de 100 vulnerabilidades de alta gravedad para el navegador Firefox en dos semanas, aproximadamente el equivalente a los hallazgos totales de investigadores globales en dos meses.

Apple anunció una tecnología llamada "Memory Integrity Enforcement (MIE)" en septiembre del año pasado, diciendo que era el resultado de cinco años de diseño colaborativo entre hardware y sistemas operativos, con el objetivo de mejorar significativamente las capacidades de protección contra ataques de memoria desde abajo hacia arriba. Sin embargo, según Calif, con la ayuda del modelo de Claude, el código de explotación para dos vulnerabilidades de macOS se desarrolló en sólo cinco días, lo que pone de relieve la mejora de la eficiencia de la IA en la investigación de seguridad ofensiva.

Duong Thai, director ejecutivo de California y experto senior en seguridad, enfatizó que este ataque no fue "automatizado" solo por Mythos, sino que se combinó con la experiencia y el juicio de investigadores de seguridad humana. En su opinión, lo que Mythos hace mejor actualmente es reconstruir y ampliar ideas de ataque en documentos públicos existentes. No ha habido ningún caso previo en el que se hayan creado nuevas tecnologías de ataque de forma independiente, por lo que el equipo considera este descubrimiento como "un nuevo avance en cierto sentido".

Zalewski cree que, aunque parte de la publicidad sobre Mythos del mundo exterior está "sobrevalorada", la última generación de herramientas ya se puede utilizar para "investigaciones significativas de vulnerabilidades y auditorías de códigos", lo que no sólo mejora la eficiencia de la detección de errores, sino que también cambia en cierta medida el paradigma de trabajo de la investigación de seguridad tradicional. En este incidente, los caminos candidatos proporcionados por la herramienta y el análisis de expertos humanos se complementaron, permitiendo que la cadena de vulnerabilidad originalmente extremadamente difícil de alcanzar finalmente tomara forma.

Según los informes, el equipo de investigación de California estaba tan entusiasmado con este descubrimiento que condujeron desde Palo Alto a la sede de Apple en Cupertino el martes para presentar personalmente el informe técnico de 55 páginas al equipo de seguridad de Apple, detallando los detalles de la vulnerabilidad explotada y el proceso de ataque. La escena en la que los cofundadores de la empresa, Bruce Dang y Duong Thai, toman fotografías en el parque también se ha convertido en una escena simbólica de "colaboración hombre-máquina para romper la línea de defensa de Apple".

De acuerdo con la práctica de la industria, Calif planea publicar detalles técnicos después de que Apple complete el parche para evitar la explotación maliciosa de la vulnerabilidad antes de que se parchee. Duong predice que, dado que Apple concede gran importancia a la seguridad, estos fallos deberían corregirse en un período de tiempo relativamente corto.

El incidente también tuvo repercusiones a nivel político. La Casa Blanca tenía reservas o incluso oposición al plan de Anthropic de ampliar gradualmente el acceso externo a Mythos, temiendo el efecto de amplificación bidireccional de los modelos de alta capacidad en el campo de la seguridad de la red. La controversia en torno a la seguridad de los modelos de IA de nueva generación está empujando a la administración Trump a reevaluar su anterior enfoque relativamente de "laissez-faire" para el desarrollo de la IA.

Actualmente, los funcionarios federales están considerando una orden ejecutiva que crearía una supervisión gubernamental más clara de los modelos de IA de vanguardia, incluida la evaluación, revisión y restricciones de acceso necesarias para modelos con la capacidad de tener impactos significativos en la seguridad. Después del incidente de vulnerabilidad de macOS, cómo utilizar la IA para mejorar las capacidades de defensa y al mismo tiempo evitar que se utilice para amplificar la superficie de ataque se está convirtiendo en un tema central que el gobierno de EE. UU., los gigantes tecnológicos y la industria de la seguridad deben enfrentar juntos.