Statistik hjælp

#1| 0

Jeg undersøger om hvorvidt mænd og kvinder bliver mindre tilbøjelig til at flytte til et fremmed land ud fra nogle faktorer. Jeg har lavet en logistisk regression og kan konkludere at kvinder er mere påvirket af politiske faktorer med et signifikansniveau på 0,0017.


Dog kan jeg ikke greje hvad mit "Estimate" på -1,2699 præcist viser. Jeg ved det viser relationen, men i hvilken værdi? Og hvordan kan jeg transformere tallet til noget brugbart?

Redigeret af Myrup d. 17-05-2017 15:09
17-05-2017 16:47 #2| 1

Jeg går ud fra, at "Politic" er en variabel, som definerer respondentens politiske engagement fra 1-5 eller lignende. (1 lav, 5 høj).

-1,26 reprænsenterer så, at for hver stigning i "Politic" (1->2, 2->3 osv.) falder Estimate-værdien med -1,26.


Hvad Estimat-værdien repræsentere kan jeg umiddelbart ikke gennemskue uden datasættet, men det plejer typisk at være x% chance for y eller en lineær linje.

17-05-2017 19:17 #3| 0

Du har lavet en model, som forsøger at estimere en forventet værdi for "Tilbøjelighed til at flytte til udlandet" hos en tilfældig respondent, afhængigt af hvad denne person svarer til dine fem underspørgsmål om henholdsvis sprog, religion, distance, kultur og politik.


Estimat-værdien -1,26 betyder at den samlede funktion for "Tilbøjelighed til at flytte til udlanet", som måles på en talskala, f.eks. mellem 1 og 10, falder med -1,26 * Den værdi en respondent svarer for "Politik"-spørgsmålet (Som f.eks. kan være formuleret noget a la "Hvor meget går du op i dansk politik på en skala fra 1-10?)


Dvs. har en person i dit tilfældet svaret på de fem spørgsmål med værdierne:


Sprog 3

religion 9

distance 4

kultur 5

politik 2


Får denne person en forventet tilbøjelighed til at flytte på 6,9 -0,02*3 + 0,03 * 9 og så videre.... = 5,64 f.eks. (har ikke regnet efter, men du forstår pointen).


MEN


Modellen er slet ikke færdig endnu, så du kan ikke bruge værdien -1,26. Dette skyldes at Probability for fire af dine varibale er større end 0,5, hvilket betyder at de ikke bidrager signifikant til at forklare variansen i Y (Tilbøjelighed). På godt dansk: Der kan ikke bevises en tydelig sammenhæng mellem disse parametre (sprog, kultur, distance og religion) og så dit Y. Derfor skal du fjerne dét parameter som har den dårligste p-værdi ( religion med 0,9320) og køre analysen igen. Hvis du stadig - hvilket du helt sikkert vil have - har parametre med en p-værdi over 0,05, skal du fjerne parametre indtil ALLE tilbageværende parametre er "signifikante" (p-værdi under 0,05)... SÅ har du en model, som kan bruges til at forudsige noget som helst :)


Held og lykke :)

17-05-2017 19:22 #4| 0

-P.s. Hvad "mænd vs. kvinder" angår, kan jeg ikke af dine outputs umiddelbart se om det er noget du undersøger for. Så med mindre der er noget jeg fuldstændigt har misforstået, så tror jeg ikke du har testet for det.


(Hvis du gerne vil undersøge kvinder vs. mænd ift. tilbøjelighed til at flytte, ville jeg da bare lave en "Compare means" og ANOVA, hvor du krydser køn med dét spørgsmål der handler om tilbøhelighed til at flytte, og se om der er en signifikant forskel. Det behøver du ikke en regressionsanalyse for).

17-05-2017 21:01 #5| 0
SurrenderAt20 skrev:-P.s. Hvad "mænd vs. kvinder" angår, kan jeg ikke af dine outputs umiddelbart se om det er noget du undersøger for.

Det er netop hvad chi^2 testen gør.

Den sammenligner flere grupper (her mænd vs kvinder) ud fra forskellige parametre, og tester signifikansen for, at de to grupper er ens.


Redigeret af ninjaskills d. 17-05-2017 21:34
17-05-2017 21:32 #6| 1

De parameter estimater du får ud er (som navnet indikerer) logistiske parameter estimater. Måden man udfra alle parametre regner en sandsynlighed ud er ved:


Pi(X) = P(Y=1) = (Exp(beta0+beta1*X1+...+beta5X5))/(1+exp(beta0+beta1*X1+...+beta5X5))

Dit parameter estimat kan du fortolke enten ved at sætte ind i ovenstående eller beregne faktor ændringen i odds, direkte som: exp(beta(i,j)-beta(i,k)

Hvor det i dit tilfælde (givet, at det er en kategorisk variabel ift. baseline, fx. "Er du politisk aktiv") vil være exp(-1,2699-0) mindre sandsynligt at en kvinde (hvis kvinde er Y=1) flytter..


Husk:

- som nævnt tidligere at teste dine insignifikante variable ud én efter en. Dette vil højst sandsynligt give dig et andet parameter estimat for Politik.

- Du skal være opmærksom på evt. multikollinearitet vil kunne gøre dine variable insignifikante og påvirke variansen af dine estimater.

- I JMP (som det ligner du benytter) skal du have fat i indicator function parameterization (rød trekant -> Indicator function), hvis du vil have parameter estimater ift. en baseline ellers får du parameter estimater ift. en middelværdi, som det oftest er brugt i medicinal industrien.

← Gå til forumoversigtenGå til toppen ↑
Skriv et svar