Et teoretisk spørgsmål: Er det muligt at skrive et computerprogram, der spiller "perfekt" poker?
Med "perfekt" poker mener jeg at ingen modstander(e) vil kunne vinde over programmet i længden uden at være heldig - højst spille lige op (collusion er selvfølgelig forbudt).
Programmet har lov til at bruge al tilgængelig statistik om sine modstandere, og det må gerne være randomiseret (så at det f.eks. nogle gange c-better med toppar og andre gange lader være).
Kan svaret skifte alt efter hvilken pokervariant vi taler om?
"Perfekt" poker?
Sådan et program kan ikke laves, men til gengæld er der noget du selv kan gøre for at blive uovervindelig uden at læse en eneste analyse eller teoribog:
www.youtube.com/watch?v=GZyNBK6M6BQ
Ban Mr_K
Hensigten med mit spørgsmål var ikke at blive mangemillionær overnight, men mere en forholdsvis uskyldig teoretisk pokerinteresse. Hvis folk ikke kan lide tanken om pokerbots, kan de bare erstatte "computerprogram" med "strategi".
Der findes (mindst) to mulige svar slags på mit spørgsmål:
1. Ja, teoretisk set findes der en mængde af "perfekte" programmer. Lad os bare sige at der er 3 programmer, og lad os kalde dem A, B og C. Så vinder A, B og C altså over ethvert andet program, og de spiller lige op mod hinanden.
2. Nej, der findes ikke et enkelt "perfekt" program. Som før har vi 3 programmer A, B og C, der vinder over alle de andre. Men A slår B, B slår C, og C slår A, så der er ikke nogen enkelt verdensmester.
I et spil som skak er det IMHO oplagt at det er mulighed 1 som er "sandheden"; men hvad med poker?
Under forudsætning af at spillet er rakefri, så er svaret ja. Jeg tror ikke svaret afhænger af varianten af poker, men er ikke 100% sikker.
Jørn
Alle almindelige varianter af poker er for komplekse til at der i dag kan udformes spilteoretiske optimale strategier (strategier der ikke kan tabe i længden). Dette udelukker selvfølgelig ikke at det kan ske i fremtiden.
Heads up limit holdem er så vidt jeg ved tilstrækkeligt simpelt til at der findes strategier der kommer tæt på 0 EV (og som derfor vil vinde over de fleste).
@K_B_B
Selv om mennesker agerer tilfældigt, er det ikke svært fremlægge en optimal strategi for f.eks. "kryds og bolle", der aldrig vil tabe, uanset hvor tilfældigt modstanderen spiller.
Hvis du spiller heads up uden rake, så er der tale om et nul-sums spil med to spillere, og i teorien kan man finde en optimal løsning på sådan et spil (http://scienceblogs.com/goodmath/2008/07/back_to_math_solving_zerosum_g.php).
Problemet er at antallet af forskellige strategier hver spiller kan vælge er astronomisk stort, da det indebærer at du forud beslutter dig for hvad du vil gøre i alle tænkelige situationer hele vejen igennem hånden, allerede inden du har fået kort. Det bliver ikke nemmere når vi snakker om et no limit spil, for der skal du også forudbestemme hvad du vil gøre ved forskellige bet størrelser, hvilket bidrager med en ekstra dimension i vektorrummet af mulige strategier.
Når vi så snakker om spil med flere modstandere og vi medregner rake, så har vi et ikke-nul sum spil med flere deltagere, og der er vi udenfor hvad matematikerne i dag anser for at være universelt "løseligt".
Så en god spiller vil forsøge at få de hænder han gerne vil spille heads up, så han kommer ind i et matematisk domæne hvor han kan komme tæt på en optimal løsning. En MEGET god spiller vil ikke være nær så bange for at komme multi way, fordi han mener at han er så meget bedre end sine modstander til at spille meget komplicerede spil at han i længden vinder mere ved det end at spille heads up med andre gode spillere der også spiller tæt på optimalt.
Det er klart at siden der er et endeligt, om end astronomisk stort, antal strategier i ethvert poker spil, så må en af dem matematisk set være optimal, men at finde den løsning, er som at finde en nål i en milliard høstakke.
Hvis du vil vide mere om spilteori, så kan du blive meget klogere her: faculty.lebow.drexel.edu/McCainR//top/eco/game/game.html
@Congo
Hvis du kan definere "perfekt poker" og udelukke bluff, så vil jeg sige ja. Det er vel efterhånden et faktum at der er ret vindende pokerbotter rundt omkring. I starten på limit poker, nu også på no limit og højere stakes. Nu kan det aldrig bevises, men jeg vil da blive meget overrasket hvis jeg ikke selv har løbet ind i mange forskellige botter i min tid ved online bordene.
Du kan jo så også spørge dig selv om det ikke netop er dette der sker med pokerspilleren der støtter sig for meget til sine trackere og stats. Nogle gør det, andre gør det ikke, og jeg tror godt at du mellem linierne kan læse min holdning. Jeg synes personligt at det tager charmen af spillet, og så sidder de 10 mand rundt om et bord og forsøger at gøre det samme. De folk er i mine øjne gode til at læse tal og justere efter det, og det er jo (desværre) sådan poker er blevet i dag. Men i den verden kan du vel godt programmere et eller andet der gør det for dig.
Jørn
Da al slags poker er symetriske nulsums spil findes der mindst en Nash ligevægt i enhver slags poker. Spiller man ligevægts strategien kan man ikke tabe (på lang sigt og uden rake). Pr defintion er ligevægts strategien i et symetrisk nulsums spil uslåelig.
Fx i sten, saks, papir: Mix mellem sten, saks og papir med 33% ssh og du kan ikke slås.
Poker er bare avanceret sten, saks, papir. Nogen kan vinde fordi andre vælger papir for tit ;)
Lisa: Poor predictable Bart, always picks rock.
Bart: Good old rock. Nothing beats that!
@HolchKnudsen
Hvis du spiller "perfekt" papir, saks og sten, så kan du ikke slås på den lange bane, men du kan heller ikke slå nogen andre, selv om de ikke spiller optimalt. Selv i det mest ekstreme tilfælde hvor modstanderen konsekvent vælger "sten" hver gang, vil du spille lige op, da du en tredjedel af gangene får uafgjort og en tredjedel vundet og en tredjedel tabt.
Men hvis du for eksempel opdager at din modstander har en aversion imod "saks" og ikke vælger den ofte nok, så kan du slå ham ved at vælge "papir" oftere.
Det vil sige at en optimal løsning ikke indebærer at være "uslåelig" hele tiden, men til gengæld at spille optimalt ud fra din statistiske viden om hvilken strategi modstanderen vælger.
Steel Chicken
Helt sikkert. Jeg påstod vist heller ikke andet. Men prøvede at påpege din pointe ved mit Simpsons citat
Men god og vigtig pointe du kommer med: At spille Nash ligevægten, eller GTO som de kalder det for i Mathematics of Poker, er ikke i sig selv et mål.
Men det er en god ting at tænke over med henblik på at undgå at blive "exploitet" af andre gode regs. GTO er "unexploitable" og uslåelig. Hvis du kender GTO strategien og kan justere løbende mod dine modstanderes leaks så skal du sq ikke sidde ved mine borde!!
Ja, på et tidspunkt...
Ligesom alt andet, bliver maskinerne bedre end menneskerne, ellers er man for naiv...
Det er selvfølgelig også deromkring online poker dør ud som fast inkomst... Det bliver umuligt pga. bots som bliver sat i gang rundt omkring på site'ne hele tiden...
HolchKnudsen rammer hovedet på sømmet.
Ved at tage udgangpunkt i en GTO strategi, så er du selvsagt unexploitable. Dvs om du i et givet spot bluffer eller valuebetter, så er du totalt indifferent med hvad Villain gør, da han ikke kan exploite dig.
Imidlertid kan du afvige fra GTO strategien hvis Villain f.eks. folder for ofte eller kalder for ofte i et givent spot. I dette tilfælde justerer du din strategi, og øger din bluff vs valuebet fordeling (altså når Villain folder for meget).
I takt med at Villain måske opdager dette, og justerer hertil, så gør man selvfølgelig selv det samme, og justerer Villain helt perfekt, jamen så er vil bare tilbage i GTO strategi. Dvs Villain kan aldrig få et edge på dig.
Anyway, det var vist bare en omskrivning af hvad HK også skrev.
Hvad hvis villain ved at han spiller exploitable og ved hvornår vi adjuster og selv adjuster på det tidspunkt?
HK og Jensen +1
Dog kan man sagtens tjene penge ved at spille GTO i poker da villains kan vælge dominerede actions (simpelt eksempelt: ikke vb'e nuts i pos på river, openfolde KK preflop for 100bbs HU, etc.). I sten saks papir findes der ikke dominerede actions.
@Congo
I dit eksempel med A slår B, B slår C, C slår A kan du bare vælge at spille som A 1/3 af tiden, som B af 1/3 tiden og som C 1/3 af tiden forudsat at de slår hinanden lige stort.
Og for the record anvender gto-strategien hverken stats, trackers eller anden analyse af modstanderens spil.
@Alle,
Jeg vil bare sige tak for de gode svar:-)
Bedste ønsker fra
Congo
Skift til plo. Det lærer en bot ikke at slå ;)