Tehno & Nauka

Kompjuteri su naučili kako da nas prevare: Zašto je to dobro?

Dvanaestog jula, prvi put u istoriji, bot koji igra poker po imenu Pluribus pobijedio je simultano nekoliko vrhunskih ljudi u najpopularnijoj kartaroškoj igri: Tekas holdemu bez ograničenja.

Ovo bi mogle da budu loše vijesti za pokeraše na internetu, ali da li to može da pomogne čovječanstvu u gomili drugih korisnijih poduhvata?

Zašto je poker težak za kompjutere?

Decenijama je poker bio smatran “suviše složenim” za mašinsko učenje.

Za razliku od šaha, gdje sve figure i potezi mogu otvoreno da se vide, poker je igra “nesavršenih informacija” – zbog skrivenih karata igrači imaju samo djelimično znanje o trenutnom stanju partije.

Poker je slavan i po blefiranju – pokušaju da se prevare drugi igrači tako da misle da stojite bolje ili lošije nego što stvarno stojite.

Ovi faktori komplikovali su način na koji vještačka inteligencija traži strategiju za dobijanje igre.

Srušene granice

Ali dominacija čovječanstva u pokeru je srušena.

Pluribus, kog je napravio Noam Braun, naučni istraživač iz Fejsbukovog odjeljenja za istraživanje vještačke inteligencije, i Tuomas Sendholm, profesor kompjuterskih nauka sa Univerziteta Karnegi Melon, očigledno su uspjeli da riješe oba ova problema.

U nizu hiljada ruku protiv 13 profesionalnih igrača – od kojih su svi osvojili više od milion dolara igrajući poker – bot je svaki put izašao kao pobjednik.

Jedan od Pluribusovih protivnika bio je i Daren Elias, osvajač rekordne četiri titule Svjetske poker turneje.

Zašto naučnici rade na mašinama koje će pobijediti čovjeka?

Ukratko: oni smatraju da partija šaha ili pokera može da pomogne vještačkoj inteligenciji da izvrši mnogo složenije zadatke.

“Koristimo poker kao osnovu za fundamentalnije probleme: kako da napravimo vještačku inteligenciju koja može da izađe na kraj sa skrivenom informacijom?”, rekao je Braun za BBC.

“Da bi vještačka inteligencija bila primijenjena u stvarnom svijetu i imala interakciju sa ljudima i drugim vještačkim inteligencijama, ona mora da bude u stanju da razumije da drugi učesnici možda vide svijet drugačije od nje i da možda imaju pristup nekim drugim informacijama.”

“Poker je sjajan simulator za takve vrste izazova”, dodao je on.

Kad je AlfaGo, koji je razvila kompanija DipMajnd u vlasništvu Gugla, postao prvi kompjuter koji je pobijedio profesionalnog igrača Goa 2015. godine, njegovi tvorci su vidjeli njegovu moguću upotrebljivost u zadacima povezanim sa hemijom i inženjerstvom – potragom za novim materijalima, na primjer.

Braun i Sendholm, s druge strane, vjeruju da Pluribusovo rješavanje problema može da ima buduću primjenu u zadacima koji su toliko raznoliki kao finansijski pregovori i navigacija automatizovanih automobila, što su sve situacije koje uključuju mnogo učesnika i nedostajuće informacije.

“Većina životnih situacija su igre nesavršenih informacija”, rekao je Sendholm.

Kako botovi uče

To je daleko od pustih snova za naučnike: prije dvije godine, Libratus, još jedan program koji su napravili Braun i Sendholm, uništio je ljudske protivnike u pokeraškim igrama jedan na jedan u jednom kazinu u Pitsburgu.

Eksperti tvrde da strategija u igrama može da se primijeni na vojne simulacije a časopis Vajerd je javio da je Stratedži robot, specijalizovana kompanija za vještačku inteligenciju koju je osnovao Sendholm, zaključio ugovor vrijedan 10 miliona dolara sa američkom vojskom u avgustu 2018. godine.

“Botovi potencijalno mogu mnogo da nas nauče o našem vlastitom procesu donošenja odluka”, objašnjava matematičar Adam Kučarski, autor knjige “Savršena opklada: Kako nauka i matematika uklanjaju sreću iz kockanja”.

“Najbolji botovi za poker uče kroz proces kontrafaktualne minimizacije kajanja – osvrtanja poslije donesene odluke i pitanja: ‘šta bi bilo da sam nešto uradio drugačije?'”

“Gubeći od botova, mislim da ljudski igrači mogu mnogo da nauče o vlastitom pristupu igrama”, dodaje Kučarski.

Ali kako na kraju Pluribus uspijeva da blefira?

E, pa Braun i Sendholm su dali botu da “nauči” poker igrajući trilion ruku protiv samog sebe i naknadnim proučavanjem vlastite strategije.

Vjerovatnije je da će strategije upotrijebljene za pobijede biti korišćene i u budućnosti.

Jedna od tih odluka bila je da se ulaže kad se ima slaba ruka da bi se protivnik natjerao da odustane – što je upravo suština blefiranja.

“Ljudi žive u ubjeđenju da je blefiranje veoma ‘ljudska’ osobina koju mašine ne mogu da oponašaju”, kaže Braun.

“Ali zapravo vidimo da mašine umiju da blefiraju i u stvarnosti mogu da blefiraju bolje od čovjeka.”

“Pluribus ne doživljava blefiranje kao nešto prevarantski ili neiskreno, samo ga doživljava kao radnju koja u nekim slučajevima zarađuje najviše novca u slučaju kad ima lošu ruku”, dodaje naučnik.

Pluribus je uspio da iznenadi i zbog toga koliko “jeftino” radi. Ovoj vještačkoj inteligenciji je bilo potrebno samo kompjuterskih resursa iz “oblaka” u vrijednosti od 150 dolara, prema istraživačima sa Karnegi Melona, dok se DipMajnd oslanjao na superkompjutere sastavljene od više od 5.000 specijalizovanih procesora, za koje se procjenjuje da su koštali milione dolara.

NAJNOVIJI NAJSTARIJI POPULARNI
Rješenje
Gost
Rješenje

Najbolje ne ne igrati karte u pare. Ni u čačkalice. Ni sa ljudima ni sa robotuma. Uvijek dođe bolji i opelješi prethodnog najboljeg.

Send this to a friend