Diagrammer for grupperede observationer
Vi skal lave to slags diagrammer for grupperede observationer. Histogram og sumkurve. Vi tager udgangspunkt i det samme eksempel som i sidste afsnit:
Observation $$(x_i)\quad$$ | Hyppighed $$(h_i)\quad$$ | Frekvens $$(f_i)\quad$$ | Summ frekv. $$(F_i)\quad$$ | Midtpunkt $$(m_i)$$ |
---|---|---|---|---|
$$]150;160]$$ | $$1$$ | $$0{,}04$$ | $$0{,}04$$ | $$155$$ |
$$]160;170]$$ | $$9$$ | $$0{,}36$$ | $$0{,}40$$ | $$165$$ |
$$]170;180]$$ | $$12$$ | $$0{,}48$$ | $$0{,}88$$ | $$175$$ |
$$]180;190]$$ | $$3$$ | $$0{,}12$$ | $$1$$ | $$185$$ |
Histogram
Histogrammet er for grupperede observationer, hvad pindediagrammet er for diskrete diskrete observationer. Skal man lave en grafisk præsentation af grupperede observationer er histogrammet et godt valg. Det ser således ud:
Vi har observationerne på den vandrette akse, og frekvenserne bliver vist som arealet af de enkelte søjler. På diagrammet kan vi se at en tern svarer til 4%.
Øvelse 1
Find frekvensen for intervallet $$]1;2]$$ i ovenstående histogram:
Frekvensen er 40%.
Sumkurve
Vi husker at vi stadig ikke har lært nogen metode til at finde fraktiler/kvartiler for grupperede observationer. Vi skal nu se på et diagram som kan bruges til dette, nemlig sumkurven. Sumkurven er tilsvarende trappediagrammet - bare for grupperede observationer. Sumkurven viser den summererede frekvens og ser således ud:
Man laver en sumkurve på følgende måde:
- Man afsætter et punkt, så man har det første venstre intervalendepunkt på førsteaksen og 0% op ad andenaksen.
- Man fortsætter ved at afsætte punkter, så man har de højre intervalendepunkter ud af førsteaksen og de tilhøjrende summerede frekvenser op ad andenaksen.
- Til sidst forbinder man punkterne med linjestykker.
Man kan finde fraktiler ved at aflæse procenten på andenaksen og så finde den tilsvarende observation på førsteaksen. Nedenunder er vist et eksempel, hvor vi aflæser den øvre kvartil (75%-fraktilen) til at være 177.
Øvelse 2
-
Aflæs 10%-fraktilen på diagrammet oven over.
10%-fraktil: 162.
-
Aflæs medianen.
Median: 172.
-
Angiv kvartilsættet.
Kvartilsæt: (166,172,177).
-
Bestem kvartilafstanden.
Kvartilafstand: 11.
Øvelse 3
Vi kigger igen på observationssættet
Observation $$(x_i)\quad$$ | Hyppighed $$(h_i)$$ |
$$]0;10]$$ | $$11$$ |
$$]10;20]$$ | $$23$$ |
$$]20;40]$$ | $$7$$ |
Tegn et histogram og en sumkurve med papir og blyant.
Bestem kvartilafstanden.
Kvartilafstanden er $$9{,}3$$
Øvelse 4
Fraktiler for grupperede observationer skal aflæses på sumkurven.
Hvorfor kan man ikke bare aflæse dem i tabellen ligesom vi kunne ved diskrete observationer?
Vi snakker om det i klassen.
Øvelse 5 (laaaaaannng øvelse)
Download filen galoptider.xlsx. Lav en statistisk analyse af tiderne. Den skal laves som grupperede observationer (du bestemmer selv intervallerne) og indeholde følgende deskriptorer og diagrammer:
- Gennemsnit
- Typeinterval
- Varians
- Standardafvigelse
- Histogram
- Sumkurve
- Kvartilsæt
- Kvartilafstand
Gem resultaterne, du får mulighed for at tjekke dem i næste afsnit.