Konfidensintervaller for middelværdien i en normalfordeling

Vi starter med at give en definition af konfidensintervallet.

Definition 1

📌

Et $$95\%$$ konfidensinterval for middelværdien i en normalfordelt population er et interval omkring gennemsnittet af en stikprøve, som med $$95\%$$ sikkerhed indeholder populationens middelværdi.

Tallet $$95\%$$ kaldes konfidensniveauet.

Forklaring af definitionen

Forstil dig at du gerne vil finde ud af hvor meget Faxe Kondi der er i en 0,5 L flaske. Den eneste praktiske måde at gøre det på, er ved at tage en stikprøve. Men stikprøvens gennemsnit er kun et estimat af hvad gennemsnittet for alle Faxe Kondi-flasker, så vi har brug for at sige noget om hvor præcist det er.

Et konfidensinterval er et interval som med stor sandsynlighed (typisk 95%) indholder den rigtige gennemsnitlige mængde Faxe Kondi - altså gennemsnittet for alle Faxe Kondi-flasker.

Eksempel 1

📌

Et 95%-konfidensinterval for Faxe Kondi-inholdet kunne f.eks. se således ud: $$$[0,501;0,509]$$$ Det ville betyde, at vi kunne være 95 % sikre på, at gennemsnittet for alle Faxe Kondi 0,5 L flasker ville ligge et sted imellem 0,501 L og 0,509 L.

Øvelse 1

📌

Det svære i konfidensintervaller er ikke så meget at finde dem, men mere at forstår, hvad de betyder. Læs derfor ovenstående definition og forklaring en gang til - grundigt! Diskuter den med din sidemand/sidedame.

Øvelse 2

📌

En klasse på Niels Brock vil undersøge, hvor langt Københavnerne i gennemsnit har til arbejde. Derfor stiller de sig ned på gaden og spørger 50 personer. De når frem til en gennemsnitlig transporttid på 25 minutter og et 95%-konfidensinterval på [20;30].

Forklar, hvad det helt præcist betyder!

Det betyder at vi med 95% sikkerhed kan sige, at københavenerne har en gennemsnitlig transportid til arbejde på mellem 20 og 30 minutter.

Signifikansniveauer

Ligesom man kan bestemme 95%-konfidensintervaller, kan man også finde konfidensintervaller med andre konfidensniveauer. Vi kan f.eks. finde 90%-konfidensintervaller eller 99% konfidensintervaller. F.eks. er et 90%-konfidensinterval for middelværdien af en normalfordeling et interval, vi er 90% sikre på indeholder fordelings middelværdi.

Har vi et 95%-konfidensinterval vil vi i 5% af tilfældene komme ud for, at fordelingens middelværdi ligger uden for konfidensintervallet. Dette tal kalder vi for signifikansniveauet.

Definition 2

📌

Signifikansniveauet $$\alpha$$ er givet ved: $$$100\% - \textrm{konfidensniveau}$$$

Eksempel 2

📌

For et 87%-konfidensinterval finder vi signifikansniveauet: $$$\alpha=100\%-87\%=13\%.$$$

Øvelse 3

📌

Bestem signifikansniveauet for følgende typer af konfidensintervaller:

  1. Et 90%-konfidensinterval.

    $$\alpha = 10\%$$

  2. Et 99%-konfidensinterval.

    $$\alpha = 1\%$$

  3. Et 99,9%-konfidensinterval.

    $$\alpha = 0{,}1\%$$

Konfidensintervaller i Geogebra

Vi skal i første omgang se, hvordan konfidensintervaller bestemmes i Geogebra.

Eksempel 3

📌

Antag at vi har en stikprøve fra en normalfordeling:

Størrelse: $$n=100$$
Estimat af middelværdi: $$\bar{x}=20$$
Estimat af standardafvigelse: $$s=5$$

Vi vi nu bestemme et 95%-konfidensinterval for normalfordelingens middelværdi.

Vi åbner sandsynlighedslommeregneren i Geogebra:

Screenshot

Vi trykker "Statistik":

Screenshot

Vi vælger "t-interval af middel":

Screenshot

Vi indtaster vores data:

Screenshot

Og vi kan aflæse konfidensintervallet:

Screenshot

Altså er konfidensintervallet [19,01;20,99] og vi er færdige.

Øvelse 4

📌

Vi kigger på en stikprøve med:

Størrelse: $$n=50$$
Estimat af middelværdi: $$\bar{x}=2000$$
Estimat af standardafvigelse: $$s=10$$

Bestem et 90%-konfidensinterval for middelværdien.

Konfidensintervallet er [1997,63; 2002,37].

Øvelse 5

📌

Betragt følgende stikprøve fra en normalfordelt population: $$${1,7,5,4,6,5,7,6,1,4,10,5,8,5,5,4,6,3,5,6,4,5,3}.$$$

  1. Angiv et estimat af populationens middelværdi.

    $$\bar{x}=5$$

  2. Angiv et estimat af populationens standardafvigelse

    $$s=2{,}02$$

  3. Bestem et 90%-konfidensinterval omkring dit estimat af populationens middelværdi.

    $$[4{,}28;5{,}72]$$

Øvelse 6

📌

Ved at undersøge den gennemsnitlige transporttid for eleverne i din klasse, skal du udtale dig om den gennemsnitlige transporttid for alle elever på Niels Brock DIG.

Øvelse 7

📌

En mand påstår at 2.-årselevernes gennemsnitshøjde i de danske gymnasier er 180cm. Undersøg om det kan være rigtigt.