Statistik-problem

#1| 0

Hey guys

Nogle der kan hjælpe med noget teoretisk omkring statistik og stikprøver til et spørgeskema.

Problemet er at finde teori (teorien) der fortæller/beregner det. Vi har et spørgeskema der er sendt ud til 100% (4050) og 1277 har svaret. Dette menes at være af høj validitet men hvor høj og hvor stor er usikkerheden?

Følgende er fundet på nettet uden uddybning eller noget:

"Lad os som eksempel se på en medlemsorganisation,
der ønsker at afdække medlemstilfredsheden. Man
udvælger simpelt tilfældigt (alle medlemmer har samme
sandsynlighed for at komme med i stikprøven) en
stikprøve på 7.500 medlemmer og stiller dem et simpelt
tilfredshedsspørgsmål. 5.000 af dem besvarer
spørgsmålet. Når vi ud fra dette vil udtale os om andelen
af tilfredse medlemmer i hele organisationen, vil vi
have en statistisk usikkerhed på lidt under 1,5%-point.
Havde vi i stedet spurgt 1.500 og fået 1.000 besvarelser
ville usikkerheden have været cirka 3%-point.
Gevinsten ved at inkludere 6.000 ekstra medlemmer i
undersøgelsen er begrænset, og man kan med rette
spørge, om det derfor ikke er spild af medlemmernes
og vores tid og penge at gøre det?"

Nogen der kan forklare dette samt også overstående problem?

// KD

10-05-2011 16:39 #2| 0


I har en stikprøve med 1277 respondenter - og I kan beregne jeres standard fejl for denne.

I det givne eksempel bliver der set på ændringen i standard fejlen, når størrelsen af stikprøven ændres fra 5000 besvarelser til 1000 besvarelser. Fokus er ikke på svarprocenter.

Dvs. jeres std. fejl er givet pga. antallet af besvarelser.

Validiteten med en svarprocent på 31,5% kan diskuteres, men ikke umiddelbart beregnes, da dette afhænger af både spørgsmål/svar og respondenter/population.



10-05-2011 17:19 #3| 0
OP

Dobbelt post

10-05-2011 17:19 #4| 0
OP

@ Hook
Teorien kender vi :)

Alt det andet du siger hjælper jo ikke?....

10-05-2011 18:19 #5| 0

Altså i vil vide om 1277 svar er repræsentativt for jeres population?

10-05-2011 18:44 #6| 0

Generelt: Jo større stikprøve ift. den samlede population, jo mere sikkert er det, at jeres stikprøve er repræsentativ for populationen.



I dit tilfælde, hvor I har sendt ud til 4050, og I har 1277 svar, er der dog beklageligvis en ret stor usikkerhed ift. stikprøverepræsentativitet.

Jeg ved ikke, hvad du mener med høj validitet i dette tilfælde. Den interne validtet har jo ikke noget med stikprøvestørrelsen at gøre og den eksterne validitet (mulighed for generalisering) er betinget af stikprøverepræsentativitet.

Det modereres delvist, såfremt de 4050 er tilfældigt udvalgt ift. den samlede population.

Selv om de er, er det dog en relativ lav svarprocent. For at sikre, at de jeres svarrespondenter er repræsentative, vil jeg anbefale jer at lave frafaldsanalyser (dvs. at I kontrollerer for, at jeres svarrespondenter ikke er statistisk signifikant forskellige fra populationen).

Jeg ved ikke, hvor meget du er inde i metodelitteraturen - men det er naturligvis et problem, hvis dem, der svarer, ikke matcher populationen. Dette problem øges, jo mere usikkerhed der er ift. stikprøverepræsentativitet. Denne usikkerhed bør undersøges via frafaldsanalyser.

10-05-2011 18:58 #7| 0

der står noget her, med en kildehenvisning
da.wikipedia.org/wiki/Repr%C3%A6sentativitet

10-05-2011 23:49 #8| 0
OP

Ok, nm.... Ingen svarer på det jeg spørg om i OP.

Det er et statistisk svar jeg leder efter - en beregning - ik alt det pladder for det ved jeg sku godt!

11-05-2011 15:30 #9| 0

Går ud fra at vi opererer med 95% konfidensintervaller. Ved interviewundersøgelser er stikprøveusikkerheden på givet ved formlem:
1,96*kvadratrod(p*(1-p)/n)

Usikkerheden er størst når p = 0,5.

Med p = 0,5 og n = 1500 interviews bliver usikkerheden:
1.96*kvadratrod(0,5*0,5/1500) = 0.0255 = 2,6%

Med p = 0,5 og n = 7500 interviews bliver usikkerheden:
1.96*kvadratrod(0,5*0,5/1500) = 0.0113 = 1,3%


Det er en fejl at der i det oprindelige indlæg står at usikkerheden med 1500 interviews er 3% - den kan maks være 2,6%. Hvis man sammenligner to undersøgelser skal man lægge variansen fra dem sammen og vistnok tage kvadratrod igen (gider ikke finde formel frem), men så bliver usikkerheden helt sikker større end 3% for sammenligning af to undersøgelser med 7500 interviews. Usikkerheden falder med kvadratroden, så generelt skal man lave 4 gange så mange interviews for at halvere usikkerheden.

Så for at svare på OP, så er der en fejl i teksten. Du kan finde formler til beregning af stikprøveuskkerheder her en.wikipedia.org/wiki/Margin_of_error og så skal du lige huske at gange med 1,96 hvis du skal beregne et konfidensinterval.

I øvrigt ville jeg stille et stort spørgsmålstegn ved om stikprøven nu er repræsenatativ, da svarprocenten kun ligger på 32%.

11-05-2011 15:39 #10| 0

@KD

Dit indlæg er meget ringe formuleret. Hvad mener du med usikkerhed?

11-05-2011 16:23 #11| 0
OP

@Rukkie
Tak - det var lige præcis det jeg skulle bruge - STJERNE!

Har dog et spørgsmål til dine beregninger:
Jeg får første til 2,53xxx % dvs 2,5% og ikke 2,6%
Jeg får andet til 1,13xxx % dvs 1,1% og ikke 1,3% - antager også her at 1500 er en typo fra din side og ment som 7500, men np:). Er det en mindre fejl fra dig eller er det mig der fucker i det?

// KD

← Gå til forumoversigtenGå til toppen ↑
Skriv et svar