Hej,
Junior har i anden tråd postet et regneark, med en formel der beregner et såkaldt konfidens niveau (?):
www.samnet.sdu.dk/~rjep00/pokerindtjeningsniveau.xls
Man kan beregne sit konfidens niveau ved hjælp af poker tracker - er der nogen der kan forklare tabellen konfidensniveau/standard divation ?
Jeg kan se at ved 10000. hænder på 3BB, og en SD på 17 har jeg på et konfidens niveau på 0.95 nedgrænse på 2 og en øvregrænse på 6 - men hvad vil det sige at jeg alt andet lige er 95% sikker på at være vindende spiller eller hvad ?
Konfidens/Standard diviation
Konfidensintervallet er det "sikkerhedsinterval" du vil teste din prøve indenfor.
Dvs at hvis du vil være 95% sikker får du en større spredning mellem den øvre og nedre grænse, end hvis du kun brugte et konfidensinterval på 50%.
Du skal selvfølgelig bruge et højt interval, f.eks. 95%, da du ikke kan bruge det til noget at vide at du med 50% sikkerhed er indenfor et givet spænd.
Med 95%, er tallet korrekt i 19 af 20 sessions af den længde du har spillet, og under givne forudsætninger (at du ikke ændrer dit spil f.eks., eller rettere, at du spiller på samme måde som i den prøve du har testet).
Skriv "define: standard deviation" (uden " " "erne) i google, så får du et bedre svar end jeg lige han give på stående fod, mht definitionen på SD.
Konfindens: bedste bud for BB/100 er 3, og med 95% sikkerhed ligger BB/100 mellem 2 og 6. Dette er signifikant forskelligt fra 0 og betyder at du er en vindende spiller.
Et tænkt eksempel ville være en BB/100 på 1, men et konfidensinterval der går fra -0,20 til 2,20. Hermed kan man ikke sige om man er en vindende spiller(over uendelig lang tid), da 0 er med i intervallet.
SD er lidt svær at forklare, men kan bruges til at regne det man kalder prædiktionsinterval ud med: Din middelværdi er 3 og 95 % af målingerne vil ligge i prædiktionsintervallet, som er fra 3-1,96*SD til 3+1,96*SD
Ovenstående kræver dog at data er normalfordelt, hvilket kun kan opnåes hvis du er 100% tiltfri.
@AndreasQ:
Tilt eller ej, så vil gennemsnittet (BB/100) være normalfordelt over tilpas mange observationer (jf. den centrale grænseværdisætning)
Det vil sige, at hvis du spiller yderligere 10k hænder, vil din winrate (det er vel dét du omtaler?) med 95% sikkerhed ligge mellem 2 og 6.
@Andreas: Pas på med formuleringen "95% sikkerhed ligger BB/100 mellem 2 og 6". Det er ganske enkelt forkert. Derudover er din udredning af prædiktionsinterval og SD misvisende. Der er markant forskel på at have et udtræk, eller at ekstrapolere på en total population.
- Asger
"Pas på med formuleringen "95% sikkerhed ligger BB/100 mellem 2 og 6". Det er ganske enkelt forkert."
uddyb venligst.
nu laver jeg jo ikke nogen reel udredning for SD, men formlen til prædiktionsintervallet har jeg fra en bog i biostatistik under beregninger på middelværdier. Men jeg vil da gerne have et bud på hvad der så er rigtigt.
@ilprincipe: Den centrale grænseværdisætning siger ikke noget om, at BB vil være normalfordelt for tilpas mange observationer - jeg tror faktisk ikke den nævner poker overhovedet :). Den siger, at for observationerne gående mod uendelig vil den observerede middelværdi gå mod den sande middelværdi.
Konfidensintervallet angiver, hvor den den sande middelværdi med en vis (95%) sikkerhed befinder sig på baggrund af det observerede (3bb). De 3bb er det bedste bud man kan give, fordi det ganske enkelt er din middelværdi (middelret estimator). Det er imidlertid kun et bud, og konfidensintervallet angiver da, hvor du med 95% sikkerhed finder din sande middelværdi.
I forhold til at pokertracker angiver 2 og 6 som grænser med en tilhørende middelværdi på 3 vil det ikke være fra en normalfordeling, da denne er symmetrisk (middelværdi burde være 4 for at dette passede).
STD måler dine afvigelser i forhold til din middelværdi. Jo større afvigelser jo større standardafvigelse. Std er kvadratroden af det meget anvendte pokerbegreb varians. Varians er den kvadrerede forskel mellem den enkelte bb/100 og den samlede middelværdi.
Eksempel. 10bb, -2 bb og 7bb. Det giver et gennemsnit på (10-2+7)/3 = 5.
Variansen er da [(10-5)^2 + (-2-5)^2 + (7-5)^2]/(3-1) = 39
Standardafvigelsen er da kvadratroden til 39 = 6,24.
Andet eksempel:
6 bb, 4 bb og 5 bb. Gennemsnit ligeledes 5 bb, men variansen er kun: (1+1+0)/(3-1) = 1 og std selvsagt også 1.
Variansen udtrykker altså, hvor spredt dine observationer er. Derfor har en lag normalt meget større varians end den tight passive.
@Agffan
Det er ikke den centrale grænseværdi sætning, menstore tals lov der siger:
"at for observationerne gående mod uendelig vil den observerede middelværdi gå mod den sande middelværdi."
Hvis du observerer BB pr. hånd, så vil den gennemsnitlige BB pr. hånd være asymptotisk normalfordelt over tilpas mange hænder - det er vel netop det den centrale grænseværdisætning siger?
Om du så skalerer den op er vel i og for sig ligegyldigt
hmm prøvede det her excel regneark af, med min session fra igår hvor jeg havde 12BB/100 over 1000 hænder. Regnearket mener at jeg er 96% sikker på at være en vindende spiller...!!!
Jeg havde en super session uden tvivl, men der skal altså nogle flere hænder til. C"mon 10000 hænder med 3BB/100 og så er man næsten sikker på at være en vindende spiller. Det giver jeg altså ikke meget for, men da jeg ikke har den store viden omkring udregningerne, så vil jeg ikke konkludere noget ud over at jeg har mine tvivl om hvor meget man kan sige ud fra små samples.
MrNielsen @ beregninger er vel under forudsætning af du får givet ligeså gode kort, i de næste 1000 hænder, hvilket vel ikke er tilfældet -men hvis det var, var du vel 96% sikker - ( eller hvad ?)
@Andreas (og andre der ikke har forståelse af konfidensintervaller, når man ekstrapolerer fra en sample til en population):
Et konfidensinterval udtrykker, helt præcist, det interval, ens middelværdi vil ligge indenfor, med XX% sikkerhed, såfremt man tog en NY sample af samme størrelse, som den man lige har taget.
Det er FORKERT, at man kan sige noget generelt om populationen (dvs. alle pokerhænder, man til enhver en tid kan spille). Man siger noget om, at hvis man udtrækker en ny sample af samme størrelse, så har man en statistisk sikkerhed (såfremt der ikke er andre variabler der rykker sig - fx skills og limit) for, at middelværdien/winrate (eller whatever man nu har beregnet et konfidensinterval for) vil ligge i samme interval.
- Asger
@Bjoernen.
Just præcis. Hvis jeg fik de samme superlækre kort igen, så vil jeg med 96% sikkerhed være en vinder, men det kan jeg da ikke bruge til noget. Selv den ringeste spiller kan vinde hvis man får gode kort.
Du lægger ud med at du burde være 95% vinder pga. du har spillet 10K hænder med 3BB/100 og det tror jeg bare ikke på for du kan have været mega heldig i den periode, så hvis beregningen forudsætter at vi får lignende kort, så kan den ikke bruges til ret meget.
Er lidt bange for at jeg fatter hat af hvad denne beregning viser og hvad det kan bruges til.
@ Asger. "(såfremt der ikke er andre variabler der rykker sig - fx skills og limit)
Og det er jo lige præcis hvad der er. først og fremmest kortene som rykker sig og aldrig er ens. Derefter dine modspillere, som ikke er de samme altid, og sidst men ikke mindst dit eget spil som rykker sig/tilter en gang imellem. Jeg mener vi skal have store samplesizes for at bruge den her konfidens beregning til noget..??