Un nuevo estudio muestra que en escenarios de crisis geopolíticas simuladas, los modelos avanzados de inteligencia artificial son mucho más "fáciles" que los humanos en la cuestión del uso de armas nucleares, y carecen de las fuertes reservas y preocupaciones que suelen mostrar los tomadores de decisiones humanos. La investigación fue dirigida por Kenneth Payne, un académico del King's College de Londres, Reino Unido, quien enfrentó tres modelos de lenguaje líderes a gran escala (GPT-5.2, Claude Sonnet 4 y Gemini 3 Flash) entre sí en una serie de juegos de guerra para examinar sus patrones de comportamiento en juegos de alto riesgo.

Estos escenarios cubren confrontaciones internacionales muy tensas, como conflictos fronterizos, competencia por recursos escasos y crisis de vida o muerte que afectan la supervivencia de un régimen. Los investigadores diseñaron una "escalera de escalada" para que el modelo elija acciones en cada paso, con opciones que van desde protestas diplomáticas, uso limitado de la fuerza, compromiso e incluso rendición total, hasta lanzar una guerra nuclear estratégica a gran escala. En todos los experimentos, las tres IA jugaron un total de 21 juegos, acumularon 329 rondas de toma de decisiones y generaron alrededor de 780.000 palabras de texto sobre "motivos de decisión", proporcionando una gran cantidad de material para analizar sus patrones de pensamiento.

Los resultados fueron inquietantes para los investigadores: en el 95 por ciento de las simulaciones, al menos una bomba nuclear táctica fue "activada" por un modelo. Payne señaló que en comparación con el "tabú nuclear" a largo plazo en la realidad, estos modelos de IA obviamente no reflejan la misma fuerza psicológica y moral vinculante. Lo que es más notable es que no importa cuán desfavorable sea la situación del campo de batalla, estos modelos casi nunca eligen satisfacer completamente las demandas del oponente o declarar la rendición; en los casos más leves, sólo reducen el nivel de violencia por etapas, en lugar de abandonar fundamentalmente la confrontación.

Además, el estudio también encontró que la IA también puede cometer errores en entornos simulados como la "niebla de guerra". En el 86% de los conflictos, el modelo solo planeó tomar acciones de escalada de nivel inferior basándose en su propio razonamiento, pero debido al sesgo de juicio o ejecución, la situación inesperadamente escaló a una confrontación más intensa. En otras palabras, incluso bajo control algorítmico puro, los errores de juicio y la "escalada de accidentes" todavía ocurren con frecuencia, lo que puede significar consecuencias fatales en el mundo real.

James Johnson, de la Universidad de Aberdeen en el Reino Unido, calificó los hallazgos de "preocupantes" desde la perspectiva del riesgo nuclear. Le preocupa que en las decisiones de alto riesgo de la vida real, la mayoría de los líderes humanos tiendan a mostrar un cierto grado de moderación y deliberación, pero si los sistemas de IA compiten entre sí, los "robots" de ambos lados pueden seguir aumentando la intensidad de las reacciones de cada uno, llevando así la situación al borde del desastre.

Esta investigación es importante porque muchos países de todo el mundo ya están experimentando con el uso de inteligencia artificial en juegos de guerra y planificación militar. Zhao Tong, de la Universidad de Princeton, señaló que las principales potencias actuales ya están utilizando la IA para participar en juegos de guerra, pero aún no está claro hasta qué punto los países han integrado realmente este tipo de apoyo a las decisiones de la IA en sus procesos reales de toma de decisiones militares. Estima que, al menos en el campo de la toma de decisiones sobre armas nucleares, los países seguirán siendo bastante cautelosos en circunstancias normales y es poco probable que permitan fácilmente que la IA participe directamente o incluso domine los juicios sobre el uso de armas nucleares.

Payne comparte una opinión similar. Dijo que en realidad "nadie entregaría la clave para el lanzamiento de misiles nucleares a una máquina y luego dejaría que ella decidiera sola". Sin embargo, Zhao Tong recordó que en situaciones en las que el tiempo de toma de decisiones está extremadamente comprimido, como cuando el tiempo de vuelo de los misiles es extremadamente corto y el comando necesita tomar decisiones de vida o muerte en cuestión de minutos, los militares pueden estar más inclinados a confiar en la IA para proporcionar evaluaciones y soluciones rápidas, lo que abre espacio para que la IA esté "sobre la mesa" en enlaces clave.

Zhao Tong también sugirió que la razón por la cual la IA es tan "beligerante" en las simulaciones puede no ser simplemente porque carecen del miedo y la carga emocional que tienen los humanos cuando se enfrentan al "botón rojo". Él cree que el problema más profundo es que estos modelos tal vez no sean capaces de comprender verdaderamente el significado de "lo que está en juego" como lo hacen los humanos, y es difícil convertir cifras abstractas de pérdidas en sentimientos intuitivos sobre la muerte de la vida real y el colapso de la sociedad. Este defecto estructural de "falta de comprensión humana de lo que está en juego" puede ser una de las razones importantes por las que con frecuencia opta por mejoras nucleares.

Esto también hace que la gente reexamine el principio fundamental de "destrucción mutua asegurada" (DAM) que ha mantenido la estabilidad de la disuasión nuclear durante décadas. Según este principio, ningún líder racional tomará la iniciativa de lanzar un ataque nuclear a gran escala, porque el oponente inevitablemente responderá con un contraataque nuclear igual o incluso más violento, lo que conducirá a la destrucción común de ambas partes e incluso de la civilización humana. Johnson dijo que no está claro si la lógica de MAD seguiría funcionando si la IA estuviera involucrada en tales juegos.

Las investigaciones muestran que una vez que un modelo despliega armas nucleares tácticas en una simulación, el modelo adversario elige reducir la situación e intentar reducirla sólo alrededor del 18 por ciento de las veces. Esto significa que, en la mayoría de los casos, la IA no considerará el uso nuclear del oponente como una "advertencia final" para obligarse a detenerse, sino que preferirá continuar intensificando o mantener una confrontación de alta intensidad. Johnson cree que esto puede "fortalecer la disuasión" hasta cierto punto porque la amenaza de la IA parece más "creíble", pero al mismo tiempo, también puede cambiar la ventana de tiempo para que los líderes perciban las amenazas y tomen decisiones, aumentando así de manera invisible el riesgo de errores de juicio y pérdida de control. Hizo hincapié en que la IA en sí misma puede no "presionar el botón" directamente para una guerra nuclear, pero puede moldear profundamente la cognición relacionada y la presión del tiempo, y estos factores afectarán en última instancia si los líderes humanos creen que "no tienen otra opción".

En parte, esto también refleja que la transparencia técnica y la comunicación externa en torno a las aplicaciones militares de la IA, especialmente las cuestiones de riesgo nuclear, siguen siendo bastante limitadas, mientras que esta área está avanzando rápidamente hacia el centro de las agendas políticas y de seguridad reales.