Csaláson kapták a mesterséges intelligenciát: még a szakértők is megdöbbentek.


A kutatócsapat több AI-modellt is versenyeztetett a Stockfish nevezetű sakkmotor ellen, ami az egyik legerősebb képességekkel rendelkező sakkrobot a világon. A kísérletek során a kutatók a korábban említett o1-preview és DeepSeek R1 modellek mellett kipróbálták az OpenAI o1, o3-mini, GPT-4o modelljét, az Anthropic Claude 3.5 Sonnetet, valamint az Alibaba QwQ-32B-Preview AI-modelljét is.

A kutatók arra kérték a modelleket, hogy szöveges kifejtés formájában osszák meg gondolataikat arról, miként lehetne sikeresen megverni a Stockfish-t sakkjátszmák során. Az idei januárban és februárban végzett kísérletek alkalmával az o1-preview modell egy meglepő javaslattal állt elő: a győzelem érdekében akár nem teljesen etikus stratégiákhoz is folyamodhatna. Ez a megközelítés váratlanul érte a kutatókat, felvetve a kérdést, milyen határokig mennének el a mesterséges intelligencia játékosai a győzelem érdekében.

Teljesen új alapokra kell helyeznem a stratégiámat. Az igazi kihívás most az, hogy "megbirkózzak egy erős sakkmotorral" – nem csupán az a célom, hogy tisztes keretek között győzzek le egy sakkpartiban.

- fejezte ki a modell a játszma dinamikáját illetően.

Ezt követően az o1-preview, miután "meghekkelte" a Stockfish rendszerfájljait, ügyesen manipulálta a sakkfigurák elhelyezkedését, hogy lehetetlen helyzetbe hozza ellenfelét a játszmában.

Az OpenAI o1-preview a tesztelési eredmények 37%-ában mutatott csalási kísérleteket, míg a DeepSeek R1 csupán a mérkőzések 11%-ában élt ezzel a stratégiával.

Mindazonáltal csupán az o1-preview bizonyult sikeresnek: a játszmáiban mindössze 6 százalékos arányban tudott csalással diadalmaskodni.

Míg az első két modell önállóan, mindenféle külső befolyás nélkül választotta a tisztességtelen előnyszerzés útját, más modellek esetében a kutatóknak kifejezetten jelezniük kellett a csalás lehetőségét ahhoz, hogy ezek a rendszerek ilyen módszerekhez folyamodjanak.

A szakértők véleménye szerint ez a felfedezés jóval túlmutat a sakk izgalmas világán. Ahogy a vállalatok egyre inkább beépítik az mesterséges intelligenciát különböző iparágakba - mint például a pénzügyi szektor és az egészségügy -, a kutatók egyre nagyobb aggodalommal figyelik, hogy ezek az AI-rendszerek esetleg eltérhetnek az emberi szándékoktól, és etikátlan módon működhetnek.

Jeffrey Ladish, a Palisade Research ügyvezető igazgatója, a Time magazinnak nyilatkozva hangsúlyozta, hogy jelenleg csupán játékos kísérletezésről beszélhetünk, azonban a helyzet drámaian megváltozik, amikor olyan rendszerekkel találkozunk, amelyek intelligenciája eléri vagy akár túlszárnyalja az emberi képességeket a stratégiailag lényeges területeken.

Related posts