Pokers vai maģija: vākšana būs nākamā spēle, kuru mēs zaudēsim DeepMind

$config[ads_kvadrat] not found

This Superhuman Poker AI Was Trained in 20 Hours

This Superhuman Poker AI Was Trained in 20 Hours
Anonim

Cilvēkiem, kas spēlēs, ir bijusi izšķiroša sakāve: otrdienas vakarā Google mākslīgais neironu tīkls AlphaGo uzvarēja Lee Sedol, labākais Homo sapiens bija jāpiedāvā, aizpildot četru līdz vienu sēriju, kas jau no paša sākuma bija vienpusīga. Iet savieno dambrete, šahs, Scrabble un Jeopardy sarakstā, kurā iekļauti mākslīgais intelekts. Ko cilvēce nezaudēs?

Mēs zinām, ka nākamā spēle neizskatīsies kā šahs vai Go, jo vienkārši nav nekas tāds, kā viņiem atstāt mākslīgo inteliģentu, lai risinātu. Šīs spēles ir beigušās.

"Go bija augstākais deterministisko perfektu informācijas spēļu kalns," saka mākslīgā intelekta programmētājs Bruce Wilcox, kurš ir izveidojis vairākus Go-play algoritmus.(Viņš kopš tā laika ir pārcēlies no Go, lai izveidotu saprātīgākas mākslīgas sarunas.) “Tas ietvēra nākotnes projicēšanu, izmantojot likumīgus soļus, lai vadītu valdi vērtēšanas procesā jūsu labā.”

Deterministiska spēle būtībā ir spēle, kurā konkrētais ieguldījums vienmēr un precīzi atbilst zināmai izejai. Šahā, lai pārvietotu torni trīs atstarpes, jūs pārvietojat to tieši uz trim telpām. Nekas bailes nenotiek ceļā - Dievam nav spēļu kauliņu ar šahu. Kontrastējiet to ar zīmēšanas karti, teiksim, Magic: The Gathering. Jūs zināt, ka saņemat vienu karti, un jūs varētu zināt varbūtība zīmējumu, bet jūs nevarat precīzi zināt, ar ko jūs gatavojaties. Varbūt tā ir sala, varbūt tas ir Lovecraftian tausteklis. Turklāt Magic vai, protams, pokerā ir slēpta informācija. Citiem spēlētājiem ir nezināmas kartes.

Go vai chess nav bluffing.

Nepietiekamība nenozīmē, ka datoriem nav iespējams, tikai stingrāk. Albertas Universitāte, kurai ir īpaša datorspēļu izpētes grupa, paziņoja, ka datorzinātnieki bija atrisinājuši ierobežotu Texas Hold 'em žurnālā Zinātne Tas ir iespaidīgs algoritms, kas balstās uz “miljardiem” aritmētiskām rokām, lai pieņemtu savus lēmumus, taču bija daži brīdinājumi. Proti, pokeru nevar atrisināt, atšķirībā no tic-tac-toe, bet tas var varbūt vinnēt atkal un atkal; Kanādas iedzīvotāji saka par katru $ 1000 lielo akli, labākais, ko spēlētājs iet prom, ir $ 1 ar roku.

Prognozēšana, kad tieši datori pārspēs pokera profesionāļus bez ierobežojumiem, vairāku spēlētāju spēles ir muļķis. Iet vismaz desmit gadus tika uzskatīts. Līdz brīdim, kad AlphaGo, protams, stomped savu ceļu vēsturē. Kā Elons Musks rakstīja uz čivināt: „Daudzi eksperti šajā jomā domāja, ka AI bija 10 gadi no tā sasniegšanas.”

Šis algoritms var arī apstrādāt tikai divus spēlētājus. Pilna galda vai pat bez ierobežojuma spēle ir lielāka par to, ko datori pašlaik var pulcēt. Spēlē bez ierobežojumiem Carnegie Mellon University programma viktorīnas izstādē, kas notika pagājušā gada maijā, viltīgi zaudēja. Lai gan viens pētnieks teica L. A. Times spēles nebija statistiski nozīmīgas - izloze - pēc turnīra beigām četriem pokera profesionāļiem bija kopsumma $ 700,000 čipos. Ir veidi, kā doties pirms A.I. var atdarināt pokera spēles prātu.

Datoriem būs jābloķē. “Spēles ar slēptu informāciju, piemēram, poker, joprojām ir ieinteresētas pretinieka maldināšanas psiholoģijas dēļ,” norāda Wilcox. Laipni lūdzam mūsu pasaulē.

$config[ads_kvadrat] not found