Jeg mangler hjælp til statistik.
Følgende spørgsmål:
- Hvad betyder det at der er ødelæggende outliers?
- Forklaring af poole?
- Hvorfor vælger man at måle på 5% signifikansniveau?
På forhånd tak
Pokernet ved alt - Statistik
Outliers:
Du har en samplesize på eksempelvis 10.
Dine observationer er følgende. 4, 56, 45, 57, 64, 75, 50, 71, 66, 150.
Her er outliers, de to observationer, i hver ende af spektret, der afviger væsentligt fra de øvrige observationer. I dette tilfælde 4 og 150. Disse kunne tyde på fejlobservationer, der skaber støj i din samplesize og de beregninger du foretager heraf.
Poole:
Poole, kan jeg ikke huske forklaringen på, på stående fod. Jeg kan nok finde den til dig hvis det endelig er.
Signifikansniveau:
Mht. signifikansniveauet, så vælges et 5% niveau fordi man hermed er "sikker" på, at forkastelsen/accepten af H-nul/H-1 hypotesen er korrekt. Sætter man niveauet højere, er der sandsynlighed for at forkaste hypoteser, der statistisk set er korrekte. Sætter man niveauet til 50%, så kan man ikke bruge sit test til noget, da man ikke kan træffe beslutninger på baggrund af 50% sikkerhed.
Eksempelvis nytter det ikke noget at fastsætte et 50% konfidensinterval, hvis man skal køre et test på, om en maskine fylder 50 ml på en kolbe indenfor en standardafvigelse på 0,5, da man ikke får nogen brugbar konklusion på baggrund af ens gennemførte test. Konklusionen kunne være (alt afhængig af, hvordan hypoteserne opstilles) at maskinen med 50% sandsynlighed, fylder 50 ml på kolben, indenfor standardafvigelsen 0,5.
Altså, i en beslutningsproces, er 50% sikkerhed ikke nok. Derfor benyttes 95%.
EDIT: Stavebøffer.
@Tight Winner: 'Hvorfor vælger man at måle på 5% signifikansniveau?'
Det er endt med nærmest at være en konvention indenfor alle forskningsgrene, at når noget er sikkert med 95% sandsynlighed, så er det en nagelfast sandhed. Man kunne godt have valgt et andet niveau, men konsensus endte ved dette niveau.
Det er i øvrigt interesant, at når den skrevne presse refererer statistiske undersøgelser, så oplyses signifikansniveauet ikke med småt under diverse tabeller, og indenfor sundhedsverdenen opereres der nogle gange med lavere signifikansniveauer. Man skal ikke altid stole på, at statistiske tal i medierne er sandheden (med 95% sikkerhed)!
En anden ting: Når meningsmålinger opgiver procenter tager den almindelige borger disse procenter for gode vare. Altså hvis gallup siger, at 30% af danskerne i dag vil stemme på sosserne, så tror de fleste, at dette er sandheden. Det har altid irriteret mig, at man ikke opgiver usikkerheden i tabellerne i den skrevne presse f.eks.: 30% +/- 4%