Konfindensintevaller uden computer

Normalfordeling med kendt standardafvigelse

(Dette afsnit kan springes over, hvis man kæmper lidt med matematikken)

Man kan bestemme konfidensintervaller uden at bruge en computer. Vi vil starte med at se på en situation hvor vi kender standardafvigelsen. I nedenstående sætning finder vi en formel til formålet. Efter sætningen vil vi se nærmere på hvad de enkelte elementer i sætningen betyder.

Sætning 1

📌

Hvis standardafvigelsen er kendt, bestemmes et konfidensinterval $$I$$ for middelværdien i en normalfordeling ved formlen: $$$I=\left[\bar{x}-z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}};\bar{x}+z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\right]$$$

Her er:

$$n$$ Stikprøvens størrelse
$$\bar{x}$$ Gennemsnittet af stikprøven
$$\sigma$$ Standardafvigelsen
$$\alpha$$ Signifikansniveauet som decimaltal
$$z_{1-\frac{\alpha}{2}}$$ $$\left(1-\frac{\alpha}{2}\right)$$-fraktilen i standardnormalfordelingen. Forklaring følger!

I konfindensintervalsformlen indgår der fraktiler for standardnormalfordelingen. Vi skal til sidst i dette afsnit se på hvad det betyder, men til at starte med vil vi bare slå dem op i en tabel.

Tabel for fraktiler i standardnormalfordelingen

$$\alpha$$ $$z_{1-\frac{\alpha}{2}}$$
1% 2,58
5% 1,96
10% 1,64

Vi regner et eksempel:

Eksempel 1

📌

Vi vil bestemme et 95%-konfidensinterval for en stikprøve med kendt standardafvigelse. Stikprøven har en størrelse på 200, et gennemsnit på 1000 og en standardafvigelse på 30. Vi har altså:

$$n$$ 200
$$\bar{x}$$ 1000
$$\sigma$$ 30
$$\alpha$$ 0,05

Vi slår $$z_{1-\frac{\alpha}{2}}$$ op i tabellen og får den til 1,96.

Vi skal nu sætte ind i formlen

$$$I=\left[\bar{x}-z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}};\bar{x}+z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\right]$$$

så det gør vi og får

$$$I=\left[1000-1{,}96\cdot\frac{30}{\sqrt{200}};1000+1{,}96\cdot\frac{30}{\sqrt{200}}\right]$$$

Vi taster hele pivetøjet ind på en lommeregner og får:

$$$I=[996;1004]$$$

Øvelse 1

📌

Vi ser på en stikprøve fra en normalfordelt population. Vi har 500 observationer, et gennemsnit på 20 og en standardafvigelse på 5.

Bestem uden Geogebra et 90%-konfidensinterval for middelværdien.

$$[19{,}63;20{,}37]$$. Måske får du ikke præcis det. Hvis du får noget tæt på er det nok fordi det er afrundede værdier i tabellen.

Forklaring af fraktiler i standardnormalfordeling

Standardnormalfordelingen er bare et andet ord for den normalfordeling som har en middelværdi på 0 og en standardafvigelse på 1. Altså $$N(0,1)$$.

En $$p$$-fraktil er en værdi $$x$$ således at $$P(X\leq x)=p$$. Det er nemmest at forstå ved at se på et eksempel.

Eksempel 2

📌

Vi vil finde $$0{,}2$$-fraktilen i standardnormalfordelingen. Vi taster N(0,1) ind i Geogebra og vælger den venstre intervalknap (se markering på tegning). Vi skriver $$0{,}2$$ ind der hvor sandsynligheden står:

Screenshot

Vi ser at $$0{,}2$$-fraktilen er $$-0{,}8416$$.

Øvelse 2

📌

Denne øvelse går ud på at tjekke fraktilerne i tabelllen:

$$\alpha$$ $$z_{1-\frac{\alpha}{2}}$$
1% 2,58
5% 1,96
10% 1,64
  1. Bestem $$1-\frac{\alpha}{2}$$ for hver af de 3 $$\alpha$$-værdier.

    0,995, 0,975 og 0,95

  2. Bestem de tilhørende fraktiler.

    De giver det der står i skemaet sæføli.

Øvelse 3

📌
Bestem et 80% konfidensinterval for middelværdien i en normalfordeling, hvor stikprøvestørrelsen er 150, gennemsnittet er 50 og standardafvigelsen er 10.

[49;51]

Normalfordeling med ukendt standardafvigelse

Vi kan bestemme et konfindensinterval for middelværdien i en normalfordeling med ukendt standardafvigelse på næsten samme måde:

Sætning 2

📌

Hvis standardafvigelsen er ukendt, bestemmes et konfidensinterval $$I$$ ved formlen: $$$I=\left[\bar{x}-t_{1-\frac{\alpha}{2}}\cdot\frac{s}{\sqrt{n}};\bar{x}+t_{1-\frac{\alpha}{2}}\cdot\frac{s}{\sqrt{n}}\right]$$$

Her er:

$$n$$ Stikprøvens størrelse
$$\bar{x}$$ Gennemsnittet af stikprøven
$$s$$ Estimat af standardafvigelsen
$$\alpha$$ Signifikansniveauet som decimaltal
$$t_{1-\frac{\alpha}{2}}$$ $$\left(1-\frac{\alpha}{2}\right)$$-fraktilen i $$t$$-fordeling med $$n-1$$ frihedsgrader. Forklaring følger!

Vi kan se at den ligner sætning 1 meget. Den eneste forskel er at der står $$t_{1-\frac{\alpha}{2}}$$ i stedet for $$z_{1-\frac{\alpha}{2}}$$. Det betyder at det ikke længere er standardnormalfordelingen vi skal finde fraktilerne i men i stedet for skal vi have fat i en fordeling der hedder $$t$$-fordelingen... eller faktisk... vi skal have fat i en bestemt $$t$$-fordeling. Der findes nemlig uendelig mange $$t$$-fordelinger - en for hver frihedshedsgrad. Vi skal ikke komme nærmere ind på hvad frihedsgrader er, men det er et begreb vi også vil støde på senere. Indtil videre er det nok at vide at en frihedsgrad er et helt positivt tal (1,2,3,4...) og at der til enhver frihedsgrad er knyttet en $$t$$-fordeling.

I geogebra heder $$t$$-fordeling "Student" (på engelsk hedder den "Student's t-distribution") og frihedsgraderne hedder "df" ("degrees of freedom" går jeg ud fra):

Screenshot

Øvelse 4

📌

Vi kan se på screenshottet at $$t$$-fordelingen ligner normalfordelingen, men...

  1. Hvad ser anderledes ud i forhold til en normalfordeling?

    Den er mere spids i toppen og den er langsommere om at flade ud

  2. Prøv at skrive 100 som frihedsgrader. Kommer den tættere på normalfordelingen?

    Ja for fa'en. Man kan ikke se forskel. Vildt nok.

Øvelse 5

📌

Vi vil bestemme et 90%-konfidensinterval for middelværdien i en normalfordeling, hvor vi ikke kender standardafvigelsen. Stikprøvestørrelsen er 50, et estimat af standardafvigelsen er 800 og gennemsnittet er 5000.

  1. Bestem $$t_{1-\frac{\alpha}{2}}$$ i Geogebra

    1,6766

  2. Bestem konfidensintervallet ved at bruge resultatet fra 1, men ellers uden at bruge computeren.

    [4810;5190]

Det kan virke lidt fjollet at vi bruger Geogebra så meget i et afsnit som hedder "uden computer", men det er fordi der ikke lige er nogen nem måde at bestemme fraktilerne på. Da jeg gik i skole brugte vi tabeller, men det er der ingen læringsmæssig fordel ved, så derfor bruger vi Geogebra.

Øvelse 6

📌

Vi har set at når vi har høje frihedsgrader ligner t-fordelingen normalfordelingen på en prik. Brug dette til at argumentere for:

  1. Hvis stikprøven er meget stor kan vi bruge formlen for kendt standardafvigelse selvom vi ikke kender standardafvigelsen.

    Den eneste forskel i formlerne er fraktilerne og de vil være ens hvis fordelingerne er ens.

  2. At dette ikke er så overaskende.

    Det er ikke overraskende, da estimatet af standardafvigelsen vil komme tættere på den rigtige standardafvigelse, jo større stikprøven er.

Konfidensintervaller for sandsynlighedsparameteren i en binomialfordeling

Der er også en formel for konfidensintervaller for $$p$$ i en binomialfordeling:

Sætning 3

📌

Hvis $$n>30$$ og $$p$$ ikker er meget stor eller meget lille kan et konfidensinterval $$I$$ for sandsynlighedsparameteren $$p$$ i en binomialfordeling bestemmes ved formlen: $$$I=\left[\hat{p}-z_{1-\frac{\alpha}{2}}\cdot\sqrt\frac{\hat{p}(1-\hat{p})}{n};\hat{p}+z_{1-\frac{\alpha}{2}}\cdot\sqrt\frac{\hat{p}(1-\hat{p})}{n}\right]$$$

Her er :

$$n$$ Stikprøvens størrelse
$$\bar{p}$$ Estimat af sandsynlighedsparameteren $$p$$. Forklaring følger!
$$\alpha$$ Signifikansniveauet som decimaltal
$$z_{1-\frac{\alpha}{2}}$$ $$\left(1-\frac{\alpha}{2}\right)$$-fraktilen i standardnormalfordelingen.

I formlen indgår et estimat $$\hat{p}$$ af $$p$$. Det er nemt at bestemme sådan et. Er stikprøvestørrelsen $$n$$ får vi: $$$\hat{p}=\frac{\textrm{antal successer}}{n}.$$$

Eksempel 3

📌

Vi laver en grim terning i ler og vil gerne bestemme sandsynligheden for at den slår en 6'er. Vi slår 100 gange med terningen og i 21 tilfælde får vi en 6'er. Derfor er: $$$\hat{p}=\frac{\textrm{Antal successer}}{n}=\frac{21}{100}=0{,}21$$$

Man kan undre sig over hvad fraktiler for en normalfordeling laver i en formel for konfidensintervaller for en binomialfordeling. Grunden til de dukker op der at når $$n$$ er stor så vil en binomialfordeling ligne en normalfordeling.

Øvelse 7

📌

Mor Jette læser eksempel 3 og synes det er så spændende at hun selv vil prøve. Men bare for at være anderledes laver hun en mønt ud af ler og kaster den 80 gange. Hun får 34 plat. Hun vil nu gerne bestemme et konfidensinterval

  1. Bestem $$\hat{p}$$.

    $$\hat{p}=0{,}=425$$.

  2. Bestem uden computer et 95%-konfidensinterval for $$p$$

    $$[0{,}32;0{,}53]$$

  3. Mor Jette mener at mønten er fair, men Jessica Priscilla tror ikke på hende. De bliver enige om at spørge dig. Hvad siger du til dem?

    Det er ikke til at vide, men da $$0{,}5\in[0{,}32;0{,}53]$$ kan vi ikke afvise at mønten er fair.