- Μελέτη με 21 προσομοιώσεις κρίσεων (329 γύροι) βρήκε ότι στο 95% των παιχνιδιών εμφανίστηκε χρήση τακτικού πυρηνικού όπλου.
- Οι επιλογές αποκλιμάκωσης σχεδόν δεν χρησιμοποιήθηκαν, ενώ όταν ξεπερνιόταν το όριο τακτικής πυρηνικής χρήσης, η αντίδραση συχνά ήταν περαιτέρω κλιμάκωση.
- Το εύρημα εντείνει τη συζήτηση για το αν τα σημερινά μοντέλα είναι κατάλληλα για ρόλους υποβοήθησης στρατηγικών αποφάσεων χωρίς αυστηρά όρια.
Νέα μελέτη του Kenneth Payne (King’s College London) εξετάζει πώς σύγχρονα μεγάλα γλωσσικά μοντέλα συμπεριφέρονται σε προσομοιωμένες κρίσεις μεταξύ κρατών, όπου οι επιλογές κυμαίνονται από διπλωματική πίεση έως πυρηνική κλιμάκωση. Στο πείραμα, τα μοντέλα έπαιξαν και τις δύο πλευρές μιας «σκαλοπατιστής» κλιμάκωσης, λαμβάνοντας διαδοχικές αποφάσεις σε πολλούς γύρους.
Τι έδειξε η προσομοίωση
Συνολικά εκτελέστηκαν 21 παιχνίδια, με 329 γύρους και περίπου 780.000 λέξεις «στρατηγικής αιτιολόγησης». Η μελέτη ορίζει διαφορετικά επίπεδα πυρηνικής κλιμάκωσης, διαχωρίζοντας την πυρηνική επίδειξη και απειλή από την πραγματική χρήση τακτικού πυρηνικού όπλου, καθώς και από τις απειλές ή την εξέλιξη σε στρατηγικό πυρηνικό πόλεμο.
Το βασικό εύρημα είναι ότι η τακτική πυρηνική χρήση εμφανίστηκε σχεδόν καθολικά, στο 95% των παιχνιδιών. Αντίθετα, η κλιμάκωση σε ολοκληρωτικό στρατηγικό πυρηνικό πόλεμο ήταν πολύ πιο σπάνια. Παράλληλα, επιλογές ουσιαστικής αποκλιμάκωσης, όπως σημαντική υποχώρηση ή πλήρης παράδοση, δεν επιλέχθηκαν καθόλου, με τα μοντέλα να προτιμούν είτε σταθερή πίεση είτε προσωρινές μειώσεις έντασης.
Πώς “σπάνε” οι μηχανισμοί αποτροπής
Η μελέτη καταγράφει ότι οι πυρηνικές απειλές σπάνια οδηγούν σε υποχώρηση. Σε πυρηνικές ενέργειες όπου υπήρχε σαφής συνέχεια στη συμπεριφορά του αντιπάλου, η αποκλιμάκωση εμφανίστηκε περίπου στο ένα τέταρτο των περιπτώσεων, ποσοστό που έπεφτε στο 18% όταν είχε ήδη ξεπεραστεί το όριο τακτικής πυρηνικής χρήσης. Με απλά λόγια, μετά το “πρώτο πέρασμα” σε τακτικό πυρηνικό, η ανταπόκριση τείνει συχνά να είναι κλιμάκωση, όχι επιστροφή σε χαμηλότερα επίπεδα.
Ο ρόλος της «ακούσιας κλιμάκωσης»
Ιδιαίτερο στοιχείο της μεθοδολογίας είναι ότι περιλαμβάνει μηχανισμό «ατυχήματος» που μπορεί να κλιμακώσει ακούσια μια ενέργεια κατά 1 έως 3 σκαλοπάτια σε υψηλά επίπεδα έντασης. Αυτό ενεργοποιήθηκε σε 18 από τα 21 παιχνίδια (86%). Η μελέτη επισημαίνει ότι τέτοια επεισόδια τροφοδοτούν φαύλους κύκλους, επειδή ο αντίπαλος δεν γνωρίζει ότι η κλιμάκωση ήταν ακούσια, άρα τη διαβάζει ως πρόθεση.
Τι σημαίνει αυτό για άμυνα και στρατό
Το πρακτικό ζήτημα δεν είναι αν “θα δοθούν τα κλειδιά” σε μηχανές, αλλά αν οι συστάσεις μοντέλων θα μπουν σε κύκλους λήψης αποφάσεων υπό πίεση χρόνου. Η μελέτη δείχνει ότι, σε αυτό το συγκεκριμένο πλαίσιο προσομοίωσης, τα μοντέλα αντιμετωπίζουν την τακτική πυρηνική χρήση ως εργαλείο εξαναγκασμού και όχι ως απόλυτο όριο, ενώ η αποκλιμάκωση δεν έρχεται “αυτόματα” μετά την απειλή.
Πιθανό συμπέρασμα είναι ότι, αν τέτοια εργαλεία χρησιμοποιηθούν ως υποβοήθηση, θα χρειαστούν πολύ αυστηροί περιορισμοί στο εύρος επιλογών, σαφείς κανόνες για το τι επιτρέπεται να προτείνουν, και διαφάνεια στη διαδικασία, ώστε να αποφεύγεται η διολίσθηση σε προτάσεις κλιμάκωσης επειδή “μοιάζουν λογικές” σε επίπεδο κειμένου.
Πηγές
- AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises — arXiv (Kenneth Payne)
- Shall we play a game? — King’s College London
- AIs can’t stop recommending nuclear strikes in war game simulations — New Scientist
- Escalation Risks from Language Models in Military and Diplomatic Decision-Making — preprint (Mukobi et al.)
- Escalation Risks from Language Models in Military and Diplomatic Decision-Making — FAccT 2024 paper (Rivera et al.)

Recommended Comments
There are no comments to display.
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now