IA Poker - Kas laimi?

0 komentarai

Praėjo dvidešimt metų nuo liūdnai pagarsėjusio pasaulio šachmatų čempiono Gario Kasparovo ir rungtynių "Deep Blue" – IBM superkompiuteris. Kasparovas prarastas į Deep Blue - ir toliau kaltino kompiuterį, kad jį valdė tikrasis žmogaus šachmatų meistras. Iš esmės Kasparovas vadino šenaniganais. Šachmatų meistras atsisakė manyti, kad šalta, skaičiuojanti mašina gali įveikti samprotavimus, mąstymą, žmogų. Realybė buvo ta, kad tikriausiai būtent dėl ​​griežto, skaičiuojančio „Deep Blue“ pobūdžio mašina sugebėjo įveikti savo kolegą.

Deep Blue negalėjo būti kūrybingas ar taikyti bet kokios formos „apšviestų“ samprotavimų – tų dalykų, kurie dažnai trukdo priimti sveiką sprendimą. „Deep Blue“ buvo skirtas šachmatų žaidimo taisyklių taikymui kuo optimaliausiu būdu, kad būtų pasiektas tam tikras rezultatas. „Deep Blue“ pasirodymas ir vėlesnė pergalė paskelbė naujo amžiaus aušrą: amžių dirbtinis intelektas ir jos gebėjimas pergudrauti, pergudrauti ir pergudrauti žmoniją.

Giliai mėlyna, paskirta didelių duomenų amžiuje.

Apibrėžti nepriekaištingą

Nepaisant stulbinamos „Deep Blue“ sėkmės – yra žaidimų, kurie sukėlė patarlių kasymosi galvą; net į mašiną panašios galvos. Vienas iš jų yra „StarCraft“ – realaus laiko strateginis žaidimas, apimantis paties žaidėjo karinės bazės kūrimą ir vėlesnį ataką prieš kitiems žaidėjams priklausančius asmenis. „StarCraft“ buvo pirmasis eSporto žaidimas, kuriame dirbo mokslininkai gigantai kaip Facebook ir Microsoft paskelbė dokumentus, susijusius su StarCraft ir AInesugebėjimas nulaužti neperšaunamo vidinio žaidimo veikimo, daugiausia dėl iš pažiūros begalinio žaidimo kintamųjų skaičiaus.

taip pat žr  Geriausi vaizdo žaidimai, kuriuose yra kazino žaidimai

Ar mašinos žino, kada „Hold'em“?

Matyt, atsakymas yra teigiamas. Dirbtinio intelekto kūrėjai „DeepStack“ sukūrė dirbtinį intelektą, kuris sugeba konkuruoti su geriausiais (žmogaus) pokerio versle. „DeepStack“ sėkmės paslaptis? Gilus mašininis mokymasis. DML imituoja žmogaus smegenis pagrindiniuose mąstymo procesuose ir iš esmės suteikia mašinai galimybę išmokyti save naujų gudrybių.

Pati „Texas Hold'em Poker“ prigimtis priklauso nuo žmogaus intuicijos savybės. Mechaninė intuicijos versija, matyt, atrasta atsitraukiant nuo ankstesnės dirbtinio intelekto sistemų strategijos, pagal kurią buvo bandoma apskaičiuoti kiekvieną žingsnį likusiam žaidimo laikui, o vietoj to, neatsilikti nuo pokyčių tik keliais žingsniais vienu metu.

Naujas dirbtinio intelekto būdas (kaip naudoja „DeepStack“) apima nuolatinį algoritmų ir ateities strategijos skaičiavimą, kai tik gaunama nauja informacija. Kaip „DeepStack“ išmokė šio konkretaus įgūdžio savo kukliajai globotinei? Išmesdamas į jį daugiau nei 10 000 atsitiktinių pokerio žaidimų situacijų.

Krikštas ugnimi

2016 m. Tarptautinė pokerio federacija išrinko trisdešimt tris profesionalius pokerio žaidėjus ir palygino juos su „DeepStack“ strategijomis. Atskyrus atvejus, kai sėkmė lėmė pergalę, nuo strategijos atvejų buvo padaryta išvada: „DeepStack“ laimėjimo procentas buvo daugiau nei 10 kartų didesnis nei tas, kurį profesionalūs žaidėjai laiko padoriu skirtumu.

Išvada ir išvados sutampa su pastarojo meto sėkme, kurią patyrė „Libratus“ - pokerio žaidimo dirbtinis intelektas ir Pitsburgo Carnegie Mellon universiteto mokslininkų idėja. „Libratus“ stojo prieš daugybę geriausių pasaulyje „Texas Hold'em“ pokerio profesionalų stulbinančioje 120,000 XNUMX pokerio rankų grupėje. Libratus išmušė keturis iš jų.

taip pat žr  Crazy Craps faktai

Dongas Kim buvo vienas iš mašinos pergudruotų žaidėjų, vėliau pranešęs, kad įpusėjus ženklui jis pradėjo įtarti, kad Libratus iš tikrųjų gali matyti jo kortas. Toliau jis teigė, kad jis nekaltino „Libratus“ dėl savęs apgaudinėjimo, tačiau dirbtinis intelektas buvo tiesiog toks geras.

Mes esame daug

Panašu, kad linksmieji Carnegie Mellon vyrai nenorėjo daug atskleisti apie „Libratus“ ar vidinį jo sprendimų priėmimo veiksnį per ginčą, tačiau vėliau paaiškėjo, kad Libratus nebuvo išskirtinis dirbtinis intelektas, o pasikliovė trimis šakelių sistema, dirbanti kartu siekiant bendro tikslas.

Pasikliaudamas sustiprinimo mokymu, iš esmės bandymų ir klaidų metodu, „Libratus“ pavyko žaisti žaidimą po žaidimo prieš save. Pradžioje jis nieko nežinojo apie specialias pokerio strategijas ar panašiai - paprasčiausiai buvo supažindintas su tuo, kokios yra žaidimo taisyklės. Pakartotinai žaisdamas prieš save, savo trijų tinklų rėmuose, jis ištyrė visus įmanomus kelius ir derinius - taip sėkmingai pasirūpindamas užduotimi prieš ją.

Visais sąžiningais atvejais reikia paminėti, kad Libratus pasinaudojo nauda, ​​kurią galėjo įvertinti kiekvienas vakaras po dienos raundų.

Vis dėlto, visi dalykai yra lygūs, Libratus viršijo net savo žmonių kūrėjų lūkesčius.

„Spin Palace“ be indėlių kazino premijos >>


šaltinis: spinpalace.com
IA Poker - Kas laimi? Atnaujinta: Birželio 18, 2019 Autorius: Damonas