A Deepstack nevű szoftver mintegy harminc kiváló, a Nemzetközi Pókerszövetség által kiválasztott hivatásos pókerjátékost vert meg egy négy hétig tartó decemberi bajnokságon, amelyen a kártyajáték egyik legbonyolultabb változatát, a No Limit Texas Hold'em-et játszották – írta a Science című tudományos folyóirat. A tudományos közlemény szerint a mesterséges intelligencia a tipikus emberi tulajdonságnak számító intuíció egyfajta verziójának köszönhette győzelmét. "A szoftver azáltal győzött, hogy betöltötte a rést az úgynevezett tökéletesen informált játékok (dáma, sakk, gó) és a tökéletlen információjú játékok (mint amilyen a póker) között".
A "tökéletesen informált játékokban" minden játékos tud mindent arról, ami a játszmában a döntéshozatal előtt történt. Ezekkel ellentétben a pókerben a logika és a megérzés egyvelegére van szükség, mert a legtöbb esetben a játékos nem tudja, hogy mi lesz ellenfele következő lépése. A kanadai és a cseh tudósok szerint a Deepstack kifejlesztett egyfajta intuíciót, és azt tovább finomította azáltal, hogy elmélyült tanulással minden döntésnél kiigazította a stratégiát. A póker hagyományosan a mesterséges intelligencia nagy kihívása, mert a résztvevők nem ugyanabból a perspektívából látják a dolgokat, és nem ugyanazokkal az információkkal rendelkeznek.
A Deepstack a folyamatos megoldás nevű technikán alapul, amelynél a program konkrét helyzetekre határozza meg a stratégiát, nem kényszerül tekintetbe venni a játszma egészét. "Minden helyzet egy mini pókerjáték. Egy nagy pókerjáték megoldása helyett e kicsi pókerjátékok millióit oldja meg. E megoldások mindegyike hozzájárul ahhoz, hogy a rendszer javítson intuícióján, és összességében megértse, miként működik egy pókerjáték" – magyarázta a kutatás vezetője.
Az Albertai Egyetemen 2006 óta dolgoznak pókerszoftveren, melynek átlagosan három másodpercre van szüksége egy-egy döntéshez. Eközben a Carnegie Mellon Egyetem algoritmusa is győzedelmeskedett: 20 napon át 200 órát játszott, és minden ember ellen győzni tudott.
A játékelméleten alapuló eredményeknek számos területen vehetik hasznát. A repülőtéri biztonsági ellenőrzőpontok automatikus rendszereit például lehet úgy tervezni, hogy a pókerhez hasonló bizonytalanságot és hiányzó információt is beépítsék.