Regne ut sannsynligheter i en normalfordeling

Eksempel

Normalfordelingen er definert ved hvilken sannsynlighetstetthet er normalfordelt variabel skal ha. I likhet med en del andre kontinuerlige fordelinger har man for normalfordelingen ikke et eksplisitt uttrykk for kumulativ fordeling. For å bestemme sannsynligheter for normalfordelte variabler må man dermed enten benytte tabeller over kumulativ fordeling eller benytte programvare der utregning av kumulativ fordeling er implementert. På temasida du ser på nå gir vi eksempler på hvordan man kan bruke standardisering av en normalfordelt variabel sammen med tabeller over en standard normalfordelfordeling til å finne sannsynligheter i en normalfordeling.

Regne ut sannsynligheter i en normalfordeling

Anta at \(X\sim \text{N}(2,3^2).\) Bruk tabell over sannsynligheter i en standard normalfordeling til å bestemme sannsynlighetene \[P(X\leq 4),~~ P(X\geq 1) ~~~\text{og}~~~P(X\leq 4|X\geq 1).\]

Illustrasjon

Sannsynligheten \(P(X\leq 4)\) er illustrert i figur 1. Her er sannsynlighetstettheten til \(\text{N}(2,3^2)\)-fordelingen tegnet i blått og sannsynligheten \(P(X\leq 4)\) er arealet av området farget i rødt. Sannsynligheten \(P(X\geq 1)\) er tilsvarende illustrert i figur 2. Igjen er sannsynlighetstettheten til \(\text{N}(2,3^2)\)-fordelingen tegnet i blått og sannsynligheten \(P(X\leq 1)\) er arealet av området farget i rødt.

Figur 1: Illustrasjon av sannsynligheten \(P(X\leq 4)\) når \(X\sim \text{N}(2,3^2).\) Sannsynlighetstettheten til \(\text{N}(2,3^2)\)-fordelingen er tegnet i blått og sannsynligheten \(P(X\leq 4)\) er lik arealet av området farget i rødt.
Figur 2: Illustrasjon av sannsynligheten \(P(X\geq 1)\) når \(X\sim \text{N}(2,3^2).\) Sannsynlighetstettheten til \(\text{N}(2,3^2)\)-fordelingen er tegnet i blått og sannsynligheten \(P(X\geq 1)\) er lik arealet av området farget i rødt.

Utregning

Utregning av \(P(X\leq 4)\): Siden \(X\sim\text{N}(2,3^2)\) har vi at forventningsverdien til \(X\) er \(\mu=2\) og standardavviket er \(\sigma=3.\) Ved å standardisere \(X\) får vi dermed at \[Z=\frac{X-\mu}{\sigma} \sim \text{N}(0,1).\] Dermed har vi at \begin{align}P(X\leq 4) &= P\left(\frac{X-\mu}{\sigma} \leq \frac{4-\mu}{\sigma}\right) \\ &= P\left(Z\leq \frac{4-2}{3}\right)\\ &= P\left(Z\leq \frac{2}{3}\right) \\ &= \Phi\left(\frac{2}{3}\right),\end{align} der \(\Phi(\cdot)\) er kumulativ fordelingsfunksjon for en standard normalfordelt variabel. Verdien til \(\Phi\left(\frac{2}{3}\right) \approx \Phi(0.67) = 0.7486\) finner vi i tabell over sannsynligheter i en standard normalfordeling. Vi har dermed at \[\underline{\underline{P(X\leq 4) = 0.7486}}.\] Man kan merke seg at denne sannsynligheten også kan visualiseres som et areal under sannsynlighetstettheten for en standard normalfordelt variabel, som illustrert i figur 3 må man da ta med arealet under sannsynlighetstettheten opp til \(z=\frac{2}{3}.\) Arealet av de røde området i figur 1 er altså lik arealet av det røde området i figur 3.

Figur 3: Illustrasjon av sannsynligheten \(P\left(Z\leq \frac{2}{3}\right)\) når \(Z\sim \text{N}(0,1).\) Sannsynlighetstettheten til \(\text{N}(0,1)\)-fordelingen er tegnet i blått og sannsynligheten \(P\left(Z\leq \frac{2}{3}\right)\) er lik arealet av området farget i rødt.

Utregning av \(P(X\geq 1)\): For å regne ut denne sannsynligheten er det naturlig å starte med å bruke komplementærsetningen. Denne sier at sannsynligheten for hendelsen \(X\geq 1\) er lik \(1\) minus sannsynligheten for den motsatte hendelse, og det motsatte av at \(X\geq 1\) er \(X<1.\) Dermed har vi at \[P(X\geq 1) = 1 - P(X < 1).\] Siden \(X\) er en kontinuerlig fordelt stokastisk variabel har vi at \(P(X < 1) = P(X\leq 1),\) se diskusjon på temasiden om sannsynlighetstetthet. Dermed har vi at \[P(X\geq 1) = 1 - P(X\leq 1).\] Videre kan vi introdusere den standardiserte variabelen \(Z\) som over. Vi får \begin{align}P(X\geq 1) &= 1 - P(X\leq 1) \\ &= 1 - P\left( \frac{X-\mu}{\sigma} \leq \frac{1-2}{3}\right) \\ &= 1-P\left(Z\leq -\frac{1}{3}\right) \\ &= 1 - \Phi\left(-\frac{1}{3}\right).\end{align} I tabell over sannsynligheter i en standard normalfordeling finner vi så \(\Phi\left(-\frac{1}{3}\right)\approx \Phi(-0.33) = 0.3703\) slik at \(P(X\geq 1) = 1 - 0.3703 = 0.6297. Vi har dermed at \[\underline{\underline{P(X\geq 1) = 0.6297}}.\]

Utregning av \(P(X\leq 4|X\geq 1)\): Dette er en betinget sannsynlighet slik at vi starter med å bruke definisjonen av betinget sannsynlighet, \begin{align}P(X\leq 4|X\geq 1) &= \frac{P(X\leq 4 \cap X\geq 1)}{P(X\geq 1)}\\ &= \frac{P(1 \leq X \leq 4)}{P(X\geq 1)}.\end{align} Sannsynligheten i nevneren har vi allerede regnet ut slik at det som gjenstår er å regne ut sannsynligheten i telleren.

Hendelsen \(X\leq 4\) kan vi åpenbart skrive som \((X\leq 4) = (1\leq X\leq 4) \cup (X < 1),\) hvor vi ser at hendelsene \(1\leq X\leq 4\) og \(X < 1\) er disjunkte. Regneregelen for sannsynligheten for en union og disjunkte hendelser gir da \(P(X\leq 4) = P(1\leq X\leq 4) + P(X < 1)\) slik at \[P(1\leq X\leq 4) = P(X\leq 4) - P(X < 1),\] se illustrasjon i figur 4.

Figur 4: Illustrasjon av sannsynlighetene \(P(1\leq X\leq 4)\) og \(P(X\leq 1)\) når \(X\sim\text{N}(2,3^2).\) Sannsynlighetstettheten til \(\text{N}(2,3^2)\)-fordelingen er tegnet i blått, sannsynligheten \(P(1\leq X\leq 4)\) er lik arealet av området farget i rødt og sannsynligheten \(P(X\leq 1)\) er lik arealet om området farget i gult.

Vi har allerede funnet at \(P(X\leq 4) = 0.7486\) og komplementærsetningen gir \(P(X < 1) = 1 - P(X\geq 1).\) Ved å bruke at vi allerede har funnet at \(P(X\geq 1) = 0.6297\) får vi \(P(X<1) = 1- 0.6297 = 0.3703.\) Dermed har vi \begin{align}P(X\leq 4|X\geq 1) &= \frac{P(X\leq 4 \cap X\geq 1)}{P(X\geq 1)}\\ &= \frac{P(1 \leq X \leq 4)}{P(X\geq 1)}\\ &= \frac{P(X\leq 4) - P(X < 1)}{P(X\geq 1)} \\ &= \frac{0.7486 - 0.3703}{0.6297}\\ &= 0.6008.\end{align} Svaret er dermed \[\underline{\underline{P(X\leq 4|X\geq 1) = 0.6008}}.\]