Sentralgrenseteoremet
Regneregel
Sentralgrenseteoremet sier essensielt at sannsynlighetsfordelingen til en sum eller et gjennomsnitt av uavhengige stokastiske variabler går mot en normalfordeling når antall ledd i summen eller antall variabler man tar gjennomsnitt over går mot uendelig. Det som kanskje er noe overraskende er at det ikke er så viktig hvilken fordeling de enkelte variablene har, fordelingen til summen eller gjennomsnittet vil uansett nærme seg en normalfordeling.
Sentralgrenseteoremet
Vi formulerer først sentralgrenseteoremet og diskuterer etterpå hvordan det anvendes i en typisk situasjon.
\(\bar{X}\) og \(\sum_{i=1}^n X_i\) blir tilnærmet normalfordelt
Teoremet angir sannsynlighetsfordelingen til \(Z\) i grensen når \(n\) går mot uendelig. I praksis vil vi selvfølgelig bare ta gjennomsnitt over endelig mange \(X_i\)-er. Hva sier teoremet oss da? Siden teoremet gir oss at sannsynlighetsfordelingen til \(Z\) konvergerer mot \(\text{N}(0,1)\)-fordelingen når \(n\) går mot uendelig, må vi ha at sannsynlighetsfordelingen til \(Z\) er tilnærmet lik \(\text{N}(0,1)\)-fordelingen når \(n\) er stor nok. For \(n\) stor nok har vi altså \[Z=\frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\approx \text{N}(0,1),\] der \(\approx\) betyr «har tilnærmet fordelingen». Siden \begin{align}Z&=\frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\\ &\Updownarrow\\ \bar{X}&=\sqrt{\frac{\sigma^2}{n}}Z+\mu,\end{align} har vi at \(\bar{X}\) er en lineær funksjon av \(Z.\) Dermed er også \(\bar{X}\) tilnærmet normalfordelt når \(n\) er stor nok, se teoremet som angir at en lineær funksjon av en normalfordelt variabel er normalfordelt, \[\bar{X}\approx\text{N}\!\left(\mu,\frac{\sigma^2}{n}\right).\] Ved samme type argumentasjon får vi også at \(\sum_{i=1}^nX_i\) blir tilnærmet normalfordelt når \(n\) er stor nok. Siden \(\bar{X}=\frac{1}{n}\sum_{i=1}^n X_i \Leftrightarrow \sum_{i=1}^n X_i = n\bar{X}\) har vi at summen av \(X_i\)-ene er en lineær funksjon av gjennomsnittet slik at også summen blir tilnærmet normalfordelt når \(n\) er stor nok. Når \(n\) er stor nok har vi at \[\sum_{i=1}^n X_i \approx \text{N}(n\mu,n\sigma^2).\]
Hvor stor må \(n\) være for å gi en god tilnærming til normalfordeling?
Hvor stor må så \(n\) være for at disse tilnærmingene til normalfordeling skal være god? Det viser seg at vi får en svært god tilnærming til normalfordeling for overraskende små verdier av \(n.\) Nøyaktig hvor stor \(n\) må være avhenger av fordelingen \(f(x)\) til \(X_i\) som man starter med. En tommelfingerregel som er mye brukt sier at tilnærmingen til normalfordeling er god når \(n\geq 30,\) men for mange fordelinger \(f(x)\) vil man ha en god tilnærming til normalfordeling også for \(n\) mindre enn dette.
Spesialtilfelle
Et spesialtilfelle av sentralgrenseteoremet er at en binomisk fordelt variabel blir tilnærmet normalfordelt når antall forsøk \(n\) er stor. Dette spesialtilfellet diskuteres på en egen temaside.