Normalfordeling som tilnærming til binomisk fordeling

Regneregel

Anta at \(X\) er binomisk fordelt med parametre \(n\) og \(p.\) Når antall forsøk \(n\) er stor nok vil da fordelingen til \(X\) være tilnærmet lik en normalfordeling med samme forventningsverdi og varians som i den binomiske fordelingen. Dette resultatet er et spesialtilfelle av sentralgrenseteoremet, noe vi utnytter i beviset lenger nede på denne siden.

Normalfordeling som tilnærming til binomisk fordeling

Vi starter med å formulere et teorem som angir at fordelingen til en standardisert versjon av \(X\) konvergerer mor en standard normalfordeling når antall forsøk \(n\) går mot uendelig.

X er tilnærmet normalfordelt

Fra resultatet i teoremet over følger det at \(X\) blir tilnærmet normalfordelt når \(n\) er tilstrekkelig stor. Argumentasjonen for dette er som følger. Siden teoremet gir at fordelingen til \(Z\) konvergerer mot \(\text{N}(0,1)\)-fordelingen når \(n\rightarrow\infty,\) må vi ha at fordelingen til \(Z\) er tilnærmet lik \(\text{N}(0,1)\)-fordelingen når \(n\) er stor nok. For \(n\) stor nok har vi altså \[Z=\frac{X-np}{\sqrt{np(1-p)}}\approx \text{N}(0,1),\] der \(\approx\) betyr «har tilnærmet fordelingen». Siden\begin{align}Z&=\frac{X-np}{\sqrt{np(1-p)}}\\ &\Updownarrow\\ X &= \sqrt{np(1-p)}Z+np\end{align} har vi at \(X\) er en lineær funksjon av \(Z.\) Dermed er også \(X\) tilnærmet normalfordelt når \(n\) er stor nok, se teoremet som angir at en lineær funksjon av en normalfordelt variabel er normalfordelt,\[X\approx\text{N}(np,np(1-p)).\] Man kan med fordel legge merke til at forventningsverdi og varians i denne normaltilnærmingen er identisk med forventningsverdi og varians i den binomiske fordelingen som man startet ut med.

Hvor stor må \(n\) være for å gi en god tilnærming til normalfordeling?

Hvor stor må så \(n\) være for at disse tilnærmingene til normalfordeling skal være god? Det viser seg at vi får en svært god tilnærming til normalfordeling for overraskende små verdier av \(n.\) En tommelfingerregel som er mye brukt sier at tilnærmingen er god hvis både \(np\geq 5\) og \(n(1-p)\geq 5.\) Hvis \(p=0.5\) får man følgelig en god tilnærming allerede for \(n=10,\) mens for verdier av \(p\) nærmere null eller en må man ha større verdier for \(n\) før man får en god tilnærming.

Eksempel

Eksempel på hvordan man kan bruke at en binomisk fordeling er tilnærmet lik en normalfordeling til å regne (tilnærmet) ut sannsynligheter i en binomisk fordeling vises på en egen temaside.