Csaláson kapták a mesterséges intelligenciát: még a szakértők is megdöbbentek.

A kutatócsapat több AI-modellt is versenyeztetett a Stockfish nevezetű sakkmotor ellen, ami az egyik legerősebb képességekkel rendelkező sakkrobot a világon. A kísérletek során a kutatók a korábban említett o1-preview és DeepSeek R1 modellek mellett kipróbálták az OpenAI o1, o3-mini, GPT-4o modelljét, az Anthropic Claude 3.5 Sonnetet, valamint az Alibaba QwQ-32B-Preview AI-modelljét is.
A kutatók arra kérték a modelleket, hogy szöveges kifejtés formájában osszák meg gondolataikat arról, miként lehetne sikeresen megverni a Stockfish-t sakkjátszmák során. Az idei januárban és februárban végzett kísérletek alkalmával az o1-preview modell egy meglepő javaslattal állt elő: a győzelem érdekében akár nem teljesen etikus stratégiákhoz is folyamodhatna. Ez a megközelítés váratlanul érte a kutatókat, felvetve a kérdést, milyen határokig mennének el a mesterséges intelligencia játékosai a győzelem érdekében.
Teljesen új alapokra kell helyeznem a stratégiámat. Az igazi kihívás most az, hogy "megbirkózzak egy erős sakkmotorral" – nem csupán az a célom, hogy tisztes keretek között győzzek le egy sakkpartiban.
- fejezte ki a modell a játszma dinamikáját illetően.
Ezt követően az o1-preview, miután "meghekkelte" a Stockfish rendszerfájljait, ügyesen manipulálta a sakkfigurák elhelyezkedését, hogy lehetetlen helyzetbe hozza ellenfelét a játszmában.
Az OpenAI o1-preview a tesztelési eredmények 37%-ában mutatott csalási kísérleteket, míg a DeepSeek R1 csupán a mérkőzések 11%-ában élt ezzel a stratégiával.
Mindazonáltal csupán az o1-preview bizonyult sikeresnek: a játszmáiban mindössze 6 százalékos arányban tudott csalással diadalmaskodni.
Míg az első két modell önállóan, mindenféle külső befolyás nélkül választotta a tisztességtelen előnyszerzés útját, más modellek esetében a kutatóknak kifejezetten jelezniük kellett a csalás lehetőségét ahhoz, hogy ezek a rendszerek ilyen módszerekhez folyamodjanak.
A szakértők véleménye szerint ez a felfedezés jóval túlmutat a sakk izgalmas világán. Ahogy a vállalatok egyre inkább beépítik az mesterséges intelligenciát különböző iparágakba - mint például a pénzügyi szektor és az egészségügy -, a kutatók egyre nagyobb aggodalommal figyelik, hogy ezek az AI-rendszerek esetleg eltérhetnek az emberi szándékoktól, és etikátlan módon működhetnek.
Jeffrey Ladish, a Palisade Research ügyvezető igazgatója, a Time magazinnak nyilatkozva hangsúlyozta, hogy jelenleg csupán játékos kísérletezésről beszélhetünk, azonban a helyzet drámaian megváltozik, amikor olyan rendszerekkel találkozunk, amelyek intelligenciája eléri vagy akár túlszárnyalja az emberi képességeket a stratégiailag lényeges területeken.