El Pentágono planea permitir que las empresas de inteligencia artificial entrenen modelos en datos clasificados

Según MIT Technology Review, el Departamento de Defensa de EE. UU. está planeando un cambio importante: construir un entorno de capacitación altamente confidencial para empresas de inteligencia artificial generativa para que puedan entrenar versiones militares de modelos grandes con datos clasificados de inteligencia militar. Esto significa que los modelos que originalmente solo "leían" y "respondían preguntas" en un entorno confidencial pueden utilizar directamente datos confidenciales como material de capacitación en el futuro, "escribiendo" así información confidencial en el modelo mismo.

Ya se están implementando algunos modelos de IA generativa, como Claude de Anthropic, en entornos clasificados para responder preguntas y ayudar en el análisis, incluso sobre objetivos iraníes. Sin embargo, actualmente estos modelos solo procesan información confidencial en función de las capacidades existentes y no reutilizarán los datos para entrenar y actualizar los propios modelos. Si se permite entrenarlo con datos clasificados, se espera que el modelo sea más preciso y eficiente a la hora de realizar tareas militares específicas, pero también introducirá riesgos de seguridad sin precedentes.

Un funcionario de defensa estadounidense anónimo dijo que se espera que entrenar el modelo personalizado del ejército con datos clasificados mejore significativamente su rendimiento y confiabilidad en misiones específicas. El plan surge en medio de una creciente demanda de modelos de IA más potentes en el ejército estadounidense: el Pentágono ha llegado a acuerdos con OpenAI y xAI de Musk para ejecutar sus modelos en un entorno clasificado, y está siguiendo una nueva estrategia de inteligencia artificial destinada a convertir al ejército estadounidense en una "fuerza de combate basada en la IA" en respuesta a la escalada del conflicto con Irán. Al cierre de esta edición, el Pentágono no se ha pronunciado oficialmente sobre este plan de entrenamiento.

Según dos personas familiarizadas con los modos operativos relevantes, la capacitación mencionada se llevará a cabo en un centro de datos certificado para proyectos clasificados, donde una determinada versión del modelo de IA se combinará con datos clasificados en el mismo entorno seguro. Según el funcionario de defensa, aunque la propiedad de los datos sigue siendo del Departamento de Defensa de EE. UU., en casos excepcionales, a los empleados de la empresa de inteligencia artificial también se les puede permitir acceder a los datos confidenciales si el personal pertinente tiene la autorización de seguridad adecuada. Antes de abordar los datos clasificados, el Pentágono planea probarlos primero con datos no clasificados, como imágenes de satélite comerciales, para evaluar las mejoras reales en la precisión y eficacia del modelo entrenado.

El ejército estadounidense ha utilizado durante mucho tiempo una generación anterior de modelos de visión por computadora para realizar el reconocimiento de objetos en imágenes y videos recopilados por drones y aviones de reconocimiento, y ha encargado a empresas a través de contratos gubernamentales que entrenen algoritmos con dichos datos. En los últimos años, también han aparecido uno tras otro modelos de lenguaje grandes dedicados y versiones de chatbot para escenarios gubernamentales, como Claude Gov lanzado por Anthropic, que enfatiza las capacidades multilingües y la implementación en un entorno seguro. Sin embargo, esta declaración de funcionarios de defensa es la primera vez que se revela claramente que empresas como OpenAI y xAI que desarrollan modelos de lenguaje a gran escala pueden entrenar directamente modelos personalizados por el gobierno con datos confidenciales.

Aalok Mehta, exjefe de políticas de IA en Google y OpenAI y ahora director del Centro de IA Wadhwani dependiente del Centro de Estudios Estratégicos e Internacionales (CSIS), señaló que, en comparación con simplemente "leer y responder" en un entorno confidencial, utilizar verdaderamente datos confidenciales para entrenar modelos traerá nuevos riesgos. Él cree que el mayor problema es que la información confidencial absorbida por el entrenamiento modelo puede "resurgir" cuando sea consultada o llamada por diferentes usuarios en el futuro. Esto es particularmente peligroso cuando se comparte un conjunto de modelos entre múltiples servicios o servicios con diferentes niveles de seguridad y diferentes necesidades de inteligencia.

Por ejemplo, Mehta dijo que si un modelo tenía acceso a inteligencia humana altamente sensible, como la identidad de un agente encubierto, esa información podría "filtrarse" accidentalmente a otra rama del ejército cuando el modelo era utilizado por otra rama del ejército que no tenía acceso. Esto no sólo representaría un riesgo de vida o muerte para las fuentes de inteligencia y el personal de primera línea, sino que también sería técnicamente difícil de prevenir por completo, especialmente cuando el mismo modelo es compartido por varias unidades. Por el contrario, cree que es relativamente más fácil "bloquear" información confidencial dentro del ejército y evitar que vuelva a la Internet abierta o a las empresas de inteligencia artificial.

En la actualidad, el gobierno de Estados Unidos ha establecido alguna infraestructura relevante: por ejemplo, la empresa de seguridad Palantir ha recibido múltiples contratos a gran escala para construir un sistema de seguridad para el gobierno que pueda responder preguntas y respuestas sobre temas confidenciales sin pasar la información a empresas de inteligencia artificial. En estos sistemas, los funcionarios pueden cuestionar modelos sobre contenido clasificado, mientras que los datos están restringidos a un entorno controlado. Sin embargo, aplicar la misma arquitectura de seguridad a la capacitación, no solo la inferencia y la respuesta a preguntas, sigue siendo un nuevo desafío técnico y de gestión.

En enero de este año, el Secretario de Defensa, Pete Hegseth, emitió un memorando instando a acelerar la introducción de más capacidades de IA en todo el sistema de defensa, promoviendo el diseño de carrera del Pentágono en este campo. La IA generativa se ha utilizado en combates reales, como clasificar objetivos potenciales y dar sugerencias de ataques prioritarios. También se ha utilizado en trabajos administrativos como redacción de contratos y organización de informes. Desde la perspectiva del sector de defensa, muchas tareas realizadas originalmente por analistas humanos pueden depender de modelos de IA más potentes en el futuro, pero esto también significa que se deben abrir grandes cantidades de datos confidenciales a los modelos.

Mehta dijo que los militares pueden querer que la IA aprenda algunos juicios sutiles que dependen en gran medida de la experiencia, como identificar pistas extremadamente sutiles en imágenes como un analista senior, o hacer conexiones complejas entre la inteligencia recién adquirida y la información histórica. Con este fin, los vastos y multilingües datos de texto, audio, imágenes y videos de las agencias de inteligencia pueden convertirse en fuentes de material de capacitación. Sin embargo, también enfatizó que es difícil explicar al mundo exterior qué tareas específicas requieren entrenamiento con datos confidenciales, porque el Departamento de Defensa tiene un fuerte incentivo para mantener en secreto sus capacidades específicas y no quiere que otros países comprendan con precisión las fronteras tecnológicas de Estados Unidos en este campo.

A los ojos del mundo exterior, la medida del Pentágono no es sólo una respuesta a las necesidades de primera línea, sino también una apuesta tecnológica de alto riesgo: una vez que la inteligencia confidencial esté profundamente integrada en grandes modelos, los militares obtendrán análisis automatizados y capacidades de asistencia para la toma de decisiones que exceden con creces las de los sistemas tradicionales. Sin embargo, también tendrá que afrontar nuevos riesgos de seguridad, como "memoria excesiva de modelo", fugas accidentales y límites de acceso borrosos. Actualmente, las agencias de defensa estadounidenses están tratando de encontrar un equilibrio entre "obtener ventaja militar" y "controlar los riesgos de seguridad" que no se ha probado completamente en la práctica mediante el establecimiento de centros de datos seguros altamente aislados, un estricto control de acceso y métodos de implementación de modelos personalizados y en capas.