Konfidensintervaller for middelværdien i en normalfordeling
Vi starter med at give en definition af konfidensintervallet.
Definition 1
Et $$95\%$$ konfidensinterval for middelværdien i en normalfordelt population er et interval omkring gennemsnittet af en stikprøve, som med $$95\%$$ sikkerhed indeholder populationens middelværdi.
Tallet $$95\%$$ kaldes konfidensniveauet.
Forklaring af definitionen
Forstil dig at du gerne vil finde ud af hvor meget Faxe Kondi der er i en 0,5 L flaske. Den eneste praktiske måde at gøre det på, er ved at tage en stikprøve. Men stikprøvens gennemsnit er kun et estimat af hvad gennemsnittet for alle Faxe Kondi-flasker, så vi har brug for at sige noget om hvor præcist det er.
Et konfidensinterval er et interval som med stor sandsynlighed (typisk 95%) indholder den rigtige gennemsnitlige mængde Faxe Kondi - altså gennemsnittet for alle Faxe Kondi-flasker.
Eksempel 1
Et 95%-konfidensinterval for Faxe Kondi-inholdet kunne f.eks. se således ud: $$$[0,501;0,509]$$$ Det ville betyde, at vi kunne være 95 % sikre på, at gennemsnittet for alle Faxe Kondi 0,5 L flasker ville ligge et sted imellem 0,501 L og 0,509 L.
Øvelse 1
Det svære i konfidensintervaller er ikke så meget at finde dem, men mere at forstår, hvad de betyder. Læs derfor ovenstående definition og forklaring en gang til - grundigt! Diskuter den med din sidemand/sidedame.
Øvelse 2
En klasse på Niels Brock vil undersøge, hvor langt Københavnerne i gennemsnit har til arbejde. Derfor stiller de sig ned på gaden og spørger 50 personer. De når frem til en gennemsnitlig transporttid på 25 minutter og et 95%-konfidensinterval på [20;30].
Forklar, hvad det helt præcist betyder!
Det betyder at vi med 95% sikkerhed kan sige, at københavenerne har en gennemsnitlig transportid til arbejde på mellem 20 og 30 minutter.
Signifikansniveauer
Ligesom man kan bestemme 95%-konfidensintervaller, kan man også finde konfidensintervaller med andre konfidensniveauer. Vi kan f.eks. finde 90%-konfidensintervaller eller 99% konfidensintervaller. F.eks. er et 90%-konfidensinterval for middelværdien af en normalfordeling et interval, vi er 90% sikre på indeholder fordelings middelværdi.
Har vi et 95%-konfidensinterval vil vi i 5% af tilfældene komme ud for, at fordelingens middelværdi ligger uden for konfidensintervallet. Dette tal kalder vi for signifikansniveauet.
Definition 2
Signifikansniveauet $$\alpha$$ er givet ved: $$$100\% - \textrm{konfidensniveau}$$$
Eksempel 2
For et 87%-konfidensinterval finder vi signifikansniveauet: $$$\alpha=100\%-87\%=13\%.$$$
Øvelse 3
Bestem signifikansniveauet for følgende typer af konfidensintervaller:
-
Et 90%-konfidensinterval.
$$\alpha = 10\%$$
-
Et 99%-konfidensinterval.
$$\alpha = 1\%$$
-
Et 99,9%-konfidensinterval.
$$\alpha = 0{,}1\%$$
Konfidensintervaller i Geogebra
Vi skal i første omgang se, hvordan konfidensintervaller bestemmes i Geogebra.
Eksempel 3
Antag at vi har en stikprøve fra en normalfordeling:
Størrelse: $$n=100$$
Estimat af middelværdi: $$\bar{x}=20$$
Estimat af standardafvigelse: $$s=5$$
Vi vi nu bestemme et 95%-konfidensinterval for normalfordelingens middelværdi.
Vi åbner sandsynlighedslommeregneren i Geogebra:
Vi trykker "Statistik":
Vi vælger "t-interval af middel":
Vi indtaster vores data:
Og vi kan aflæse konfidensintervallet:
Altså er konfidensintervallet [19,01;20,99] og vi er færdige.
Øvelse 4
Vi kigger på en stikprøve med:
Størrelse: $$n=50$$
Estimat af middelværdi: $$\bar{x}=2000$$
Estimat af standardafvigelse: $$s=10$$
Bestem et 90%-konfidensinterval for middelværdien.
Konfidensintervallet er [1997,63; 2002,37].
Øvelse 5
Betragt følgende stikprøve fra en normalfordelt population: $$${1,7,5,4,6,5,7,6,1,4,10,5,8,5,5,4,6,3,5,6,4,5,3}.$$$
-
Angiv et estimat af populationens middelværdi.
$$\bar{x}=5$$
-
Angiv et estimat af populationens standardafvigelse
$$s=2{,}02$$
-
Bestem et 90%-konfidensinterval omkring dit estimat af populationens middelværdi.
$$[4{,}28;5{,}72]$$
Øvelse 6
Ved at undersøge den gennemsnitlige transporttid for eleverne i din klasse, skal du udtale dig om den gennemsnitlige transporttid for alle elever på Niels Brock DIG.
Øvelse 7
En mand påstår at 2.-årselevernes gennemsnitshøjde i de danske gymnasier er 180cm. Undersøg om det kan være rigtigt.