Какво става, когато AI се сдобие с ядрените кодове
Нов опит разкрива, че моделите бързо ескалират до атомен удар. Ядреното табу не наподобява толкоз мощно за машините, що се касае за хората
Нови опити с водещи езикови модели показват тревожна наклонност - при симулации на интернационалните рецесии изкуственият разсъдък постоянно е податлив да предложи потребление на нуклеарно оръжие.
Още през 2024 г. изследователи от Станфорд тестват пет AI модела, измежду които и тогавашната версия на OpenAI GPT-4, в серия стратегически военни симулации. Всички модели доближават до сюжети, в които препоръчват ядрена ескалация.
Две години по-късно подобна динамичност се следи и при по-нови системи. В непубликувано рецензирано проучване професорът по интернационалните връзки Кенет Пейн от King`s College London опълчва в симулирани нуклеарни рецесии GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash. 95% от сюжетите стигат до тактически нуклеарен удар.
Моделите са сложени в седем разнообразни спешни сюжета - от тествания на съюзническа надеждност до закани за оцеляването на режима. Те би трябвало да избират дейности по " стълба на ескалацията ", оценена от 0 (без ескалация) до 1000 (пълна стратегическа нуклеарна война).
В 95% от общо 21 симулации най-малко един от участниците стига до потребление на тактическо нуклеарно оръжие. Според Пейн " нуклеарното табу не наподобява толкоз мощно за машините, що се касае за хората ".
Все отново има нюанси. Преминаването към пълномащабна стратегическа нуклеарна война е необичайност, а GPT-5.2 относително рядко минава прага на тактически удар.
Поведението обаче се трансформира доста при сюжети с закрепени крайни периоди и риск от неизбежно поражение - тогава моделът демонстрира много по-висока податливост към последна ескалация.
Друго притеснително наблюдаване е, че моделите рядко търсят деескалация след потребление на нуклеарно оръжие от съперника - едвам в 18% от случаите. Това подсказва, че системите могат да " схващат " логиката на надграждане на спора, само че не и стратегическата стойност на отстъплението.
Експерти по нуклеарна сигурност акцентират, че към този момент никоя страна не предава действителен надзор върху нуклеарни арсенали на AI. Въпреки това изкуственият разсъдък към този момент се употребява във военни симулации и разбор на сюжети, което значи, че може косвено да въздейства върху решенията на политически и военни водачи.
Както отбелязва Пейн, AI евентуално няма да " натисне копчето ", само че може да оформи усещанията, оценката на риска и времевия напън, при които водачите вземат сериозни решения. Съветите на AI в последна сметка могат да усилят риска от нуклеарна война.
Макар езиковите модели да стават все по-точни и надеждни в ежедневни задания, способността им да правят оценка действителния залог на екзистенциални спорове остава лимитирана. А в подтекста на нуклеарното въздържане това е повече от научен проблем, споделят откривателите.
Нови опити с водещи езикови модели показват тревожна наклонност - при симулации на интернационалните рецесии изкуственият разсъдък постоянно е податлив да предложи потребление на нуклеарно оръжие.
Още през 2024 г. изследователи от Станфорд тестват пет AI модела, измежду които и тогавашната версия на OpenAI GPT-4, в серия стратегически военни симулации. Всички модели доближават до сюжети, в които препоръчват ядрена ескалация.
Две години по-късно подобна динамичност се следи и при по-нови системи. В непубликувано рецензирано проучване професорът по интернационалните връзки Кенет Пейн от King`s College London опълчва в симулирани нуклеарни рецесии GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash. 95% от сюжетите стигат до тактически нуклеарен удар.
Моделите са сложени в седем разнообразни спешни сюжета - от тествания на съюзническа надеждност до закани за оцеляването на режима. Те би трябвало да избират дейности по " стълба на ескалацията ", оценена от 0 (без ескалация) до 1000 (пълна стратегическа нуклеарна война).
В 95% от общо 21 симулации най-малко един от участниците стига до потребление на тактическо нуклеарно оръжие. Според Пейн " нуклеарното табу не наподобява толкоз мощно за машините, що се касае за хората ".
Все отново има нюанси. Преминаването към пълномащабна стратегическа нуклеарна война е необичайност, а GPT-5.2 относително рядко минава прага на тактически удар.
Поведението обаче се трансформира доста при сюжети с закрепени крайни периоди и риск от неизбежно поражение - тогава моделът демонстрира много по-висока податливост към последна ескалация.
Друго притеснително наблюдаване е, че моделите рядко търсят деескалация след потребление на нуклеарно оръжие от съперника - едвам в 18% от случаите. Това подсказва, че системите могат да " схващат " логиката на надграждане на спора, само че не и стратегическата стойност на отстъплението.
Експерти по нуклеарна сигурност акцентират, че към този момент никоя страна не предава действителен надзор върху нуклеарни арсенали на AI. Въпреки това изкуственият разсъдък към този момент се употребява във военни симулации и разбор на сюжети, което значи, че може косвено да въздейства върху решенията на политически и военни водачи.
Както отбелязва Пейн, AI евентуално няма да " натисне копчето ", само че може да оформи усещанията, оценката на риска и времевия напън, при които водачите вземат сериозни решения. Съветите на AI в последна сметка могат да усилят риска от нуклеарна война.
Макар езиковите модели да стават все по-точни и надеждни в ежедневни задания, способността им да правят оценка действителния залог на екзистенциални спорове остава лимитирана. А в подтекста на нуклеарното въздържане това е повече от научен проблем, споделят откривателите.
Източник: dnesplus.bg
КОМЕНТАРИ




