Histogram

Det aller vanligste plottet for å visualisere verdiene i et datasett er histogram. Mange programvarer har ferdige funksjoner som lager et histogram for et gitt datasett.

Histogram

Et histogram er en omtrentlig representasjon av verdiene i datasettet. Detaljene i hvordan et histogram konstrueres kan variere noe mellom ulike programvarer. Vi beskriver her hvordan man i Matlab konstruerer et histogram.

Anta at vi har et datasett som består av \(n\) observasjoner eller målinger, som vi betegner med \(x_1,x_2,\ldots,x_n,\) og la \(x_{(1)}\) og \(x_{(n)}\) betegne henholdsvis den minste og den største verdien i datasettet. Man deler da intervallet \([x_{(1)},x_{(n)}]\) inn i \(m\) like lange underintervaller, der \(m=10\) dersom man ikke spesifiserer noe annet. Man teller så opp antall observasjoner i hvert av de \(m\) underintervallene og plotter resultatet som et søylediagram. Et eksempel på et histogram er gitt i figur 1.

Figur 1: Eksempel på et histogram med \(m=20\) underintervaller. Observerte verdier er representert langs \(x\)-aksen og antall observasjoner i hvert underintervall er plottet langs \(y\)-aksen.