Kontinuerte fordelinger
Indtil videre har vi arbejdet med terninger, mønter, kortspil osv. De sandsynlighedsfelter vi har set indtil videre har det til fælles at de er diskrete. Det betyder, at udfaldsrummet består af enkelte adskilte sandsynligheder. På en terning er der f.eks. 6 udfald der hver har en sansynlighed på $$\frac{1}{6}$$.
Men hvad hvis man nu f.eks. vil opskrive sandsynlighedsfordelingen for vægt? Tager du et tilfældigt menneske er der ikke enkelte adskilte muligheder for personens vægt. Det er jo ikke sådan at mulighederne er ...70,71,72,73... kg. Man kan jo også veje 70,5 kg eller måske endda 70,54981365756168 kg hvis man måler med en vægt der er nøjagtig nok. Mulighederne udgør derfor et interval. En sådan sandsynlighedsfordeling kaldes en kontinuert fordeling.
Ligesom ved binomialfordeling betegnes de enkelte udfald med $$X$$ som også her kaldes den stokastiske variabel. Måler man vægt er den stokastiske variabel $$X$$ altså vægten.
Øvelse 1
Afgør, hvilke af følgende sandsynghedsfordelinger der diskrete og hvilke som er kontinuerte. I de tilfælde der er tale om en kontinuert fordeling, skal du angive, hvad den stokastiske variabel betegner.
-
Vi trækker et kort og noterer kortets kulør (klør, ruder, hjerter, spar).
Diskret.
-
Vi måler højden på en tilfældig udvalgt mand.
Kontinuert. Den stokastiske variabel er mandens højde.
-
Vi spørger en tilfældig voksen på gaden om han/hun har kørekort.
Diskret.
-
Vi spørger en tilfældig voksen på gaden, hvad han/hun har af indkomst.
Kontinuert. Den stokasiske variabel er indkomsten.
-
Vi måler temperaturen i et klasselokale på Niels Brock.
Kontinuert. Den stokastiske variabel er temperaturen.
-
Vi spørger en kvinde på gaden, hvor man gange hun har været på McD i løbet af sidste måned.
Diskret.
Når man vil opskrive sandsynlighedsfordelingen for en kontinuert fordeling kan man ikke gøre ligesom de diskrete fordeligner, hvor vi lavede en tabel. I stedet kan vi beskrive sandsynlighederne med en funktion.
Definition 1
En tæthedsfunktion er en funktion som kan bruges til at udregne sandsynligheder for en kontinuert sandsynlighedsfordeling på følgende måde:
Sandsynligheden for den stokastiske variabel $$X$$ ligger i et interval findes ved at markere intervallet på x-aksen, og så finde arealet mellem intervallet og tæthedsfunktionen.
Forvirret? Det er nok nemmere at forstå med et eksempel:
Eksempel 1
Betragt tæthedsfunktionen:
Vi vil gerne finde sandsynligheden $$P(X\geq 0)$$ altså at $$X$$ ligger i intervallet $$[0;\infty]$$. Vi markerer nu intervallet $$[0;\infty[$$ på x-aksen:
og skraverer arealet mellem intervallet og grafen:
Det skraverede areal ser ud til at udgøre halvdelen af det samlede areal under grafen. Altså har vi $$P(X\geq 0)=0{,}5$$.
Sandsynlighedsfordelingen fra ovenstående eksempel kaldes en normalfordeling og den skal vi lære mere om i næste kapitel.
Da den samlede sandsynlighed altid er 1 kan vi se, at hele arealet under enhver tæthedsfunktion må være 1.
Øvelse 2
Hvad er $$P(X\leq 0)$$ for sandsynlighedsfordelingen i eksempel 1?
$$P(X\leq 0)=0{,}5$$
Øvelse 3
Betragt tæthedsfunktionen:
Udfra tæthedsfunktionen skal du komme med nogle ca. værdier for sandsynlighederne:
-
$$P(2\leq X \leq 6)$$
$$P(2\leq X \leq 6)=0{,}5$$
-
$$P(2\leq X \leq 9)$$
$$P(2\leq X \leq 9)=0{,}75$$
-
$$P(X\geq 8)$$
$$P(X\geq 8)=0{,}25$$
-
$$P(X\leq 5{,}5)$$
$$P(X\leq 5{,}5)=0{,}5$$
Sandsynlighedsfordelingen fra ovenstående øvelse er en såkalt $$\chi^2$$-fordeling. Det mærkelige krøllede X er det græske bogstav "chi" (udtales ki). Vi vil støde på $$\chi^2$$-fordelingerne igen når vi skal lave $$\chi^2$$-test som er et selvstændigt kapitel her på mathhx.