Sannsynlighetstetthet
En stokastisk variabel som kan alle verdier i et intervall på tallinja eller alle verdier på hele tallinja kalles en kontinuerlig stokastisk variabel. Sannsynlighetstettheten til en kontinuerlig stokastisk variabel angir i en viss forstand med hvilke sannsynligheter den stokastiske variabelen antar de mulige verdiene.
Sannsynlighetstetthet
Vi starter med å definere hva vi skal mene med sannsynlighetstettheten til en kontinuerlig stokastisk variabel.
Notasjon
Merk at samme notasjon \(f(x)\) benyttes om punktsannsynligheten for en diskret stokastisk variabel som for sannsynlighetstettheten for en kontinuerlig stokastisk variabel. En fordel med å benytte samme notasjon for disse to størrelsene er at mange regneregler for punktsannsynligheter og sannsynlighetstettheter da vil se like ut. Hvis vi ønsker å snakke om \(f(x)\) for en stokastisk variabel \(X\) uten å angi om \(X\) er en diskret eller kontinuerlig stokastisk variabel er det vanlig å omtale \(f(x)\) som fordelingen til \(X.\)
Det benyttes ulike notasjoner for sannsynlighetstettheten for en kontinuerlig stokastisk variabel \(X\). De to mest vanlige er \(f(x)\), som benyttes på denne siden, og \(f_X(x)\). I notasjonen \(f_X(x)\) minner indeksen \(X\) oss på at dette er sannsynlighetstettheten for den stokastiske variabelen \(X\). I situasjoner hvor vi har flere stokastiske variabler kan det være nyttig å bruke en slik notasjon for å holde sannsynlighetstetthetene for de ulike stokastiske variablene fra hverandre. Sannsynlighetstetthetene for tre stokastiske variabler \(X\) og \(Y\) og \(Z\) vil da skrives som henholdsvis \(f_X(x)\), \(f_Y(y)\) og \(f_Z(z).\)
Kommentarer
Merk at en sannsynlighetstetthet \(f(x)\) er ikke en sannsynlighet. Følgelig er det ikke noe krav om at \(f(x)\) skal være mindre eller lik en.
Sannsynligheten for enhver hendelse som kan spesifiseres ved den kontinuerlige stokastiske variabelen \(X\) kan beregnes fra sannsynlighetstettheten \(f(x)\). Vi har for eksempel at \[P(X \leq x) = \int_{-\infty}^x f(x)\mbox{d}x.\]
For en kontinuerlig stokastisk variabel \(X\) vil sannsynligheten for at \(X\) tar en bestemt verdi \(x\) alltid være lik null, \[P(X=x) = 0.\] Dette betyr spesielt at man for en kontinuerlig stokastisk variabel \(X\) alltid vil ha at
\[ \begin{align} P(a<X<b) &= P(a\leq X< b) \\ &=P(a<X\leq b)\\ &=P(a\leq X\leq b). \end{align} \]
Egenskaper til en sannsynlighetstetthet
En sannsynlighetstetthet \(f(x)\) for en kontinuerlig stokastisk variabel \(X\) vil alltid ha følgende egenskaper:
- \(f(x)\geq 0\)
- \( \int_{-\infty}^\infty f(x)\mbox{d}x = 1\)
- \(P(a < X\leq b) = \int_a^b f(x)\mbox{d}x\)
Visualisering og tolkning av en sannsynlighetstetthet
For å visualisere en sannsynlighetstetthet er det vanlig å plotte \(f(x)\) som en vanlig matematisk funksjon. I figur 1 vises dette for en stokastisk variabel \(X\) med sannsynlighetstetthet gitt ved \[f(x) = \frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}(x-2)^2}, -\infty<x<\infty.\]
En sannsynlighet \(P(a<X\leq b)\) er lik arealet av området avgrenset av \(x\)-aksen, kurven \( f(x)\) og de to vertikale linjene \(x=a\) og \(x=b\). For samme sannsynlighetstetthet som vist i figur 1, er dette illustrert i figur 2 og 3. I figur 2 er arealet av området som er farget grønt lik \(P(1<X\leq 2)\), mens i figur 3 er arealet av området som er farget grønt lik \(P(1<X\leq 3.5)\).