Facebookova umetna inteligenca premagala 6 profesionalnih poker igralcev
Facebook je prejšnji teden objavil, da so s pomočjo raziskovalcev iz Carnegie Mellon ustvarili umetno inteligenten bot, ki je v šest-igralski Hold’em poker igri sposoben premagati profesionalce. Med drugim je Pluribus, kot so novonastalega bota poimenovali pri Facebooku, “odločno” premagal nekaj zelo zvenečih imen svetovnega pokra, med njimi sta bila tudi dva “World Series of Poker Main Event” zmagovalca.
Podrobnosti o tem, kako so raziskovalci uspeli ustvariti tako dominantnega bota za večigralski način igranja – od nekdaj največji izziv umetne inteligence – so objavljene v znanstvenem članku, ki je bil objavljen v reviji Science.
Bot Pluribus je bil narejen na temeljih Libratusa. Umetno inteligentnega bota, ki je leta 2017 dominiral v igri z dvema igralcema. Pluribus se je naučil igrati poker samo z igranjem proti samemu sebi. Tukaj ni bilo vključenih nobenih predhodnih podatkov, ali igranja z drugimi boti. Ker je sama igra pokra izjemno kompleksna, za Pluribus ni bilo mogoče, da bi le-ta predvidel poteze daleč v prihodnost: namesto tega je bot uporabil novi iskalni algoritem, ki mu je pomagal sprejemati odločitve v sedanjosti, glede na predvidevanje zgolj nekaj potez naprej (namesto, da bi poizkušal predviditi vse poteze do konca igre). Poleg tega je Pluribus uporabil novi in hitrejši “self-play” algoritem, s katerim si je pomagal pri procesiranju vseh skritih informacij, ki so prisotne pri pokru in so ključne za končni rezultat.
“Vsega skupaj so ti napredni algoritmi, ki so omogočili učenje in treniranje Pluribusa, porabili zelo malo procesne moči in spomina – ekvivalentno manj kot 150 ameriških dolarjev vrednih resursov oblačnih storitev”, je zapisal Facebookov raziskovalec in znanstvenik na področju umetne inteligence, Noam Brown.
Pluribus ostal brez poraza
Med enim od eksperimentov je Pluribus igral 12 dni zapored proti večim profesionalcem (ti so dejansko imeli motivacijo za zmago, saj je bil skupni sklad v višini 50.000 ameriških dolarjev). Če poizkušamo prikazati dominanco Pluribusa, lahko povemo, da je bil toliko boljši od ostalih igralcev, da bi v primeru, če bi igrali z žetoni po 1 dolar, na uro zaslužil okrog 1.000 dolarjev (v tekmi proti petim igralcem).
Kar se tiče komentarjev s strani profesionalcev, ki so igrali proti Pluribusu, so ti precej podobni tistim, ko je Googlov AphaGo premagal svetovne prvake v igri Go. Najbolj pogosto je bilo slišati, da je umetna inteligenca izvajala precej drugačne poteze kot človeški igralci. “Med igro je bilo opaziti nekaj potez, ki jih ljudje nikoli ne izberejo”, je povedal poker profesionalec, Michael Gagliano. “Za razliko ljudi je Pluribus preden so se sploh prve tri karte obrnile, že večkrat dvignil stavo. Zabavno je bilo opazovati in igrati proti takšnemu igralcu, s takšnimi potezami”, je povedal Seth Davies, prav tako profesionalec.
Namen te raziskave in eksperimentov ni ustvariti ultimativno poker napravo (ali pač?), temveč raziskati, kako se umetna inteligenca znajde v pogojih, kjer so vključene različne skrite informacije. Facebook je mnenja, da bi lahko uspeh Pluribusa prenesli v ostale “real-world” interakacije. Med drugim takšne, ki vključujejo preprečevanje goljufij, kiber varnost in boj proti škodljivim in zlonamernim vsebinam na spletu.
Prijavi napako v članku