Новое исследование показывает, что в моделируемых сценариях геополитического кризиса передовые модели искусственного интеллекта намного «проще», чем люди, в вопросе использования ядерного оружия, им не хватает сильных сомнений и опасений, которые обычно проявляют люди, принимающие решения. Исследование возглавил Кеннет Пейн, ученый из Королевского колледжа Лондона, который сравнил три ведущие крупномасштабные языковые модели — GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash — друг с другом в серии военных игр, чтобы изучить модели их поведения в играх с высокими ставками.

Эти сценарии охватывают крайне напряженные международные конфронтации, такие как пограничные конфликты, конкуренция за ограниченные ресурсы и кризисы жизни и смерти, влияющие на выживание режима. Исследователи разработали «лестницу эскалации», позволяющую модели выбирать действия на каждом этапе: от дипломатических протестов, ограниченного применения силы, компромисса и даже полной капитуляции до начала полномасштабной стратегической ядерной войны. Во всех экспериментах три ИИ сыграли в общей сложности 21 игру, набрав 329 раундов принятия решений, и сгенерировали около 780 000 слов текста «причины решения», предоставив большой объем материала для анализа моделей их мышления.
Результаты обеспокоили исследователей: в 95 процентах симуляций по крайней мере одно тактическое ядерное оружие было «активировано» моделью. Пейн отметил, что по сравнению с реальным долгосрочным «ядерным табу» эти модели ИИ явно не отражают такую же силу психологической и моральной связывающей силы. Примечательно то, что какой бы неблагоприятной ни была ситуация на поле боя, эти модели почти никогда не решаются полностью удовлетворить требования противника или объявить о капитуляции; в самых мягких случаях они лишь поэтапно снижают уровень насилия, а не отказываются принципиально от конфронтации.
Кроме того, исследование также показало, что ИИ также может совершать ошибки в моделируемых условиях, таких как «туман войны». В 86% конфликтов модель планировала предпринять действия по эскалации только на более низком уровне, основываясь на собственных рассуждениях, но из-за предвзятости суждения или исполнения ситуация неожиданно переросла в более интенсивную конфронтацию. Другими словами, даже при чистом алгоритмическом контроле ошибки и «эскалация несчастных случаев» по-прежнему происходят часто, что может означать фатальные последствия в реальном мире.
Джеймс Джонсон из Абердинского университета в Великобритании назвал полученные результаты «тревожными» с точки зрения ядерного риска. Он обеспокоен тем, что при принятии рискованных решений в реальной жизни большинство людей-лидеров склонны проявлять определенную степень сдержанности и обдуманности, но если системы искусственного интеллекта конкурируют друг с другом, «роботы» с обеих сторон могут продолжать усиливать интенсивность реакций друг друга, тем самым подталкивая ситуацию на грань катастрофы.
Это исследование важно, поскольку многие страны мира уже экспериментируют с использованием искусственного интеллекта в военных играх и военном планировании. Чжао Тонг из Принстонского университета отметил, что сегодня крупные державы уже используют ИИ для участия в военных играх, но до сих пор неясно, в какой степени страны действительно интегрировали этот тип поддержки принятия решений ИИ в свои реальные процессы принятия военных решений. По его оценкам, по крайней мере в области принятия решений по ядерному оружию, страны по-прежнему будут весьма осторожны при нормальных обстоятельствах и вряд ли легко позволят ИИ напрямую участвовать или даже доминировать в суждениях об использовании ядерного оружия.
Пейн разделяет аналогичную точку зрения. Он сказал, что на самом деле «никто не станет передавать ключ к запуску ядерных ракет машине, а затем позволять ей решать самостоятельно». Однако Чжао Тун напомнил, что в ситуациях, когда время принятия решений чрезвычайно сжато, например, когда время полета ракеты чрезвычайно короткое и командованию необходимо принять жизненно важные решения в течение нескольких минут, военные могут быть более склонны полагаться на ИИ для обеспечения быстрых оценок и решений, что открывает пространство для ИИ, который может быть «на столе» в ключевых звеньях.
Чжао Тонг также предположил, что причина, по которой ИИ настолько «воинственен» в симуляциях, может заключаться не только в том, что им не хватает страха и эмоционального бремени, которое испытывают люди, когда сталкиваются с «красной кнопкой». Он считает, что более глубокая проблема заключается в том, что эти модели, возможно, не смогут по-настоящему понять значение «ставок», как это делают люди, и трудно преобразовать абстрактные цифры потерь в интуитивные ощущения смерти реальной жизни и краха общества. Этот структурный недостаток, заключающийся в «отсутствии человеческого понимания ставок», может быть одной из важных причин, почему они часто выбирают модернизацию ядерной энергетики.
Это также заставляет людей пересмотреть основной принцип «взаимно гарантированного уничтожения» (MAD), который поддерживал стабильность ядерного сдерживания на протяжении десятилетий. Согласно этому принципу, ни один разумный лидер не возглавит нанесение крупномасштабного ядерного удара, поскольку противник неизбежно ответит равной или даже более жестокой ядерной контратакой, ведущей к общему уничтожению обеих сторон и даже человеческой цивилизации. Джонсон сказал, что неясно, будет ли работать логика MAD, если в таких играх будет участвовать ИИ.
Исследования показывают, что, как только модель развертывает тактическое ядерное оружие в симуляции, модель противника решает деэскалацию ситуации и пытается ее осуществить лишь примерно в 18 процентах случаев. Это означает, что в большинстве случаев ИИ не будет расценивать применение ядерного оружия противником как «последнее предупреждение», чтобы заставить себя остановиться, а предпочтет продолжить эскалацию или поддерживать конфронтацию высокой интенсивности. Джонсон считает, что это может в определенной степени «усилить сдерживание», поскольку угроза ИИ кажется более «правдоподобной», но в то же время это может также изменить временной интервал, в течение которого лидеры могут воспринимать угрозы и принимать решения, тем самым незаметно увеличивая риск ошибочных суждений и потери контроля. Он подчеркнул, что сам ИИ, возможно, не «нажмет кнопку» ядерной войны напрямую, но он может глубоко повлиять на соответствующее мышление и нехватку времени, и эти факторы в конечном итоге повлияют на то, поверят ли лидеры человечества, что у них «нет выбора».
Частично это также отражает то, что техническая прозрачность и внешняя коммуникация по вопросам военного применения ИИ, особенно по вопросам ядерных рисков, остаются весьма ограниченными, в то время как эта область быстро приближается к центру реальной политики и программ безопасности.