Normalfordelingen er meget grundlæggende sandsynlighedsfordeling, men også en teknisk svær sandsynlighedsfordeling. Man kan definere den ved at opskrive forskriften for dens tæthedsfunktion.
Definition 15.2.1 En normalfordelt stokastisk variabel \(X\) er en kontinuert stokastisk variabel med en tæthedsfunktion på formen.
Ud fra definitionen kan vi se, at en givet normalfordelt stokastisk variabel er bestemt ved \(\sigma \) og \(\mu \), da det er de to eneste parametre i funktionen ud over \(x\). Man kan vise at disse to parametre er hhv.
middelværdi og standardafvigelse for \(X\). MEN forskriften i definitionen er for kompliceret til at vi (gymnasieelever) kan regne på den (måske regner vi lidt på den på A-niveau), så vi skruer ned for ambitionerne og starter forfra.
For os er det nok at vide:
• En normalfordelt stokastisk variabel er en kontinuert stokastisk variabel med klokkeformet tæthedsfunktion.
• Normalfordelingen er fastlagt ved middelværdien \(\mu \) og standardafvigelsen \(\sigma \).
• Middelværdien er \(x\)-værdien til det punkt hvor tæthedsfunktionen har sit maksimum, og tæthedsfunktionen er symmetrisk omkring middelværdien.
Vi benytter skrivemåden \(X\sim N(\mu ,\sigma )\) til at skrive at \(X\) er en normalfordelt stokastisk variabel med middelværdi \(\mu \) og standardafvigelse \(\sigma \). I stedet for ”normalfordelt stokastisk variabel ” vil vi
nogle gange bare skrive ”normalfordeling”.
Eksempel 15.2.1 Betragt grafen for en tæthedsfunktion
Grafen kan godt være tæthedsfunktion for en normalfordeling. Det kan vi se fordi den er symmetrisk (omkring \(x=5\)) og har form som en klokke.
Det er rent faktisk grafen for tæthedsfunktion for normalfordelingen \(X\sim N(5,1)\). Altså normalfordelingen med middelværdi \(5\) og standardafvigelse \(1\).
Øvelse 15.2.1
Her ses graferne for 4 tæthedsfunktioner:
a) Hvilke af disse grafer kan ikke være graf for en tæthedsfunktion for en normalfordeling?
Løsning 15.2.1
a) Graf 1 og 2 kan ikke være tæthedsfunktioner for normalfordelingen. Graf 1 er ikke klokkeformet og Graf 2 er ikke symmetrisk.
Eksempel 15.2.2 Da en normalfordeling er en kontinuert sandsynlighedsfordeling, finder vi sandsynlighederne som arealer under tæthedsfunktionen. Betragt normalfordeling med tæthedsfunktionen:
Vi bestemmer \(P(3{,}4 \leq X \leq 4{,}5) \) ved at finde arealet svarende til \(3{,}4 \leq x \leq 4{,}5\):
Vi ser at arealet er på ca. \(\frac {1}{4}\), så vi konkluderer at
\[P(3{,}4 \leq X \leq 4{,}5) \approx 25\%\]
Øvelse 15.2.2
Betragt følgende tæthedsfunktion for en normalfordeling:
Vurder følgende sandsynligheder
a) \(P(X\leq 2)\)
b) \(P(X\geq 2)\)
c) \(P(1{,}5\leq X\leq 3)\)
d) \(P(1\leq X\leq 1{,}7)\)
Løsning 15.2.2
a) \(P(X\leq 2)=0{,}5\)
b) \(P(X\geq 2)=0{,}5\)
c) \(P(1{,}5\leq X\leq 3)=0{,}8\)
d) \(P(1\leq X\leq 1{,}7)=0{,}25\)
Betydning af middelværdi og standardafvigelse
Vi kan vurdere middelværdien og standardafvigelsen ud fra tæthedsfunktionen.
Eksempel 15.2.3 Her ses grafen for tæthedsfunktionen for en normalfordeling
Vi kan se at grafen er symmetrisk omkring \(x=5\), så vi konkludere at \(\mu = 5\)
Øvelse 15.2.3
Her ses grafen for tæthedsfunktionen for en normalfordeling:
a) Vurder middelværdien
Løsning 15.2.3
a) \(\mu =2\)
Det er sværere at vurdere standardafvigelsen. Men der findes en regel som kan hjælpe os her:
Sætning 15.2.1 (68-95-99,7-reglen) For en normalfordelt stokastisk variabel \(X\sim N(\mu ,\sigma )\) gælder følgende:
Sandsynligheden for at finde \(X\) indenfor en afstand af \(1\sigma \) fra \(\mu \) er \(68\%\).
Sandsynligheden for at finde \(X\) indenfor en afstand af \(2\sigma \) fra \(\mu \) er \(95\%\).
Sandsynligheden for at finde \(X\) indenfor en afstand af \(3\sigma \) fra \(\mu \) er \(99{,}7\%\).
Eksempel 15.2.4 Betragt grafen for tæthedsfunktionen for en normalfordeling.
Vi kan se at grafen er symmetrisk omkring \(x=6\), så \(\mu =6\). Vi finder standardafvigelsen ved at se hvor langt vi skal gå fra middelværdien for at få et areal på \(68\%\). Vi prøver at lave et areal på \(68\%\) ved at gå
symmetrisk ud fra middelværdien:
Sådan, nu ligner det ca. \(68\%\). Vi kan se at vi er gået \(1\) ud til begge sider, så \(\sigma \approx 1\).
Øvelse 15.2.4
Betragt grafen for tæthedsfunktionen for en normalfordeling.
a) Vurder middelværdien.
b) Vurder standardafvigelsen.
Løsning 15.2.4
a) \(\mu =3\)
b) \(\sigma =2\)
Øvelse 15.2.5 (Svær)
Her er tre tæthedsfunktioner for tre forskellige normalfordelinger
a) Placer graferne i rækkefølge ud fra middelværdi, fra mindste til største.
b) Placer graferne i rækkefølge ud fra standardafvigelse, fra mindste til største.
Løsning 15.2.5
a) grøn, rød, blå
b) blå, grøn, rød
Øvelse 15.2.6 (Svær)
En Amerikaner vil gerne starte en skofabrik. Hun ved at skostørrelser for mænd er normalfordelt \(X\sim N(11;1{,}5)\).
a) Brug 68-95-99,7-reglen til at vurdere hvilken mandestørrelser hun skal producere. Der kan være flere rigtige svar til denne opgave.
Løsning 15.2.6
a) Hun kunne f.eks. vælge at producere sko i størrelserne 6,5-15,5. Så har hun \(99{,}7\%\) af mændene som potentielle kunder.
Standardnormalfordelingen
Normalfordelingen \(Z\sim N(0;1)\) kaldes standardnormalfordelingen. Læg mærke til at vi bruger bogstavet \(Z\) i stedet for \(X\), når vi har med standardnormalfordelingen af gøre.
Øvelse 15.2.7
Lad \(Z\sim N(0;1)\).
a) Hvad kaldes denne fordeling?
b) Hvad er dens middelværdi og standardafvigelse?
c) Bestem \(P(Z\geq 0)\)
d) Bestem \(P(-1 \leq Z\leq 1)\) (VINK: brug 68-95-99,7-reglen)
e) Bestem \(P(Z\leq -2)\) (VINK: brug 68-95-99,7-reglen)