Godt at vide om om $$\chi^2$$-test

Der skal være mindst 5 i hver forventet værdi

Når man laver en $$\chi^2$$-test for uafhængighed bliver resultatet upålideligt hvis man har en for lille stikprøve. En tommelfingerregel er at der skal være mindst 5 i hver forventet værdi.

Øvelse 1

📌

En gruppe elever fra Niels Brock beslutter sig for at lave en undersøgelse af om der er sammenhæng mellem politisk overbevisning (stemmer rødt eller blåt). De når frem til følgende resultat:

Tavle

  1. Opstil et skema der viser de forventede værdier.
    å Rød
    Mand 4,76 5,24
    Kvinde 5,24 5,76
  2. Afgør om vi ud fra undersøgelsen kan påvise en forskel mellem kønene og deres politiske overbevisning.

    Stikprøve er for lille til at man kan lave en $$\chi^2$$-test, så derfor kan vi ikke konkludere noget ud fra undersøgelsen.

Hvordan afviger stikprøven fra $$H_0$$?

I en $$\chi^2$$-test for uafhængighed undersøger vi om stikprøven er i overensstemmelse med $$H_0$$. Altså om vi skal forkaste eller acceptere $$H_0$$. Det er dog også interessant hvordan stikprøven afviger fra $$H_0$$. Lad os sige, at vi tester om der er sammenhæng mellem køn og politisk overbevisning (stemmer rødt eller blåt). Her er det ikke kun interessant om der en forskel, men også i hvilken retning den er. Har kvinder en højere tilbøjelighed til at stemme rødt end mænd? Eller er det mon omvendt?

Eksempel 1

📌

Vi vender tilbage til undersøgelsen med sammenhæng mellem køn og kage:

Tavle

Vi vil nu se i hvilken retning stikprøven afviger for det forventede (at der ikke var sammenhæng mellem køn og kagevalg).

Vi går ind i sandsynlighedslommeregneren i Geogebra og under "statistik" finder vi $$\chi^2$$-test. Vi taster skemaet ind og sætter et flueben i "$$\chi^2$$-bidrag":

Tavle

og vi kan nu se hvor meget de bidrager hver især.

Tavle

Ud fra tabellen kan vi se at det ser ud til at der er størst forskel på mænd og kvinder når det kommer til drømmekage. Ved Chokoladenkagen er der næsten ingen forskel.

Dog er $$p$$-værdien 40%, så forskellene er slet ikke store nok til vi kan konkludere noget.

Øvelse 2

📌

Vi vender tilbage til rideskolen ponyklubben og navnet på deres nye hoppe:

Tavle

Ved hvilket navn var forskellen mellem aldersgrupperne mest markant?

Musse er meget mere populært hos juniorene end hos resten af medlemmerne.