Kjikvadratfordeling

Kjikvadratfordelingen er viktig spesialtilfelle av gammafordelingen. Kjikvadratfordelingen benytter svært ofte i forbindelse med konstruksjon av hypotesetester og en del også i forbindelse med konfidensintervall.

Kjikvadratfordeling

Vi starter med å definere kjikvadratfordelingen ved å angi hvordan man kan konstruere en variabel med denne fordelingen ut fra uavhengige standard normalfordelte variabler.

Kommentar

Kjikvadratfordelingen har altå en parameter, som vanligvis betegnes med den greske bokstaven \(\nu\) (som på norsk leses som «ny») Som angitt i definisjonen er det vanlig å kalle \(\nu\) for «antall frihetsgrader». Grunnen til at \(\nu\) kalles for dette er at \(X\) kan konstrueres ved hjelp av nettopp \(\nu\) standard normalfordelte \(Z_i\)'er. Siden \(Z_i\)'ene er uavhengige av hverandre kan man tenke seg at hver \(Z_i\) representerer en frihetsgrad.

Notasjon

For å spesifisere at en stokastisk variabel \(X\) er kjikvadratfordelt med \(\nu\) frihetsgrader er det vanlig å skrive \(X\sim \chi^2_\nu.\)

Eksempler på sannsynlighetstetthet

Figur 1 og 2 viser sannsynlighetstettheter for en del kjikvadratfordelinger. I figur 1 vises tettheten i rødt når antall frihetsgrader er \(\nu=1,\) i blått for \(\nu=2,\) i grønt for \(\nu=3\) og i brunt for \(\nu=4.\) I figur 2 vises tilsvarende tettheten i rødt for \(\nu=10,\) i blått for \(\nu=20,\) i grønt for \(\nu=30\) og i brunt for \(\nu=40.\)

Figur 1: Sannsynlighetstettheter \(f(x)\) for kjikvadratfordelinger med \(\nu=1\) i rødt, med \(\nu=2\) i blått, med \(\nu=3\) i grønt, og med \(\nu=4\) i brunt.
Figur 2: Sannsynlighetstettheter \(f(x)\) for kjikvadratfordelinger med \(\nu=10\) i rødt, med \(\nu=20\) i blått, med \(\nu=30\) i grønt, og med \(\nu=40\) i brunt.

Kumulativ fordelingsfunksjon

Kumulativ fordelingsfunksjon kan finnes ved å benytte generell sammenheng mellom \(f(x)\) og \(F(x).\) For \(x\geq 0\) får vi her

\[ F(x) = \int_0^x \frac{1}{2^{\frac{\nu}{2}}\Gamma\left(\frac{\nu}{2}\right)} t^{\frac{\nu}{2}-1}e^{-\frac{t}{2}}\text{d}t. \]

Generelt kan dette integralet dog ikke skrives på noen enkel analytisk form. Nå er det relativt sjelden man har behov for å evaluere \(F(x)\) i en kjikvadratfordeling, men hvis man likevel kommer i en situasjon hvor man har behov for dette bør man benytte et dataprogram der evaluering av \(F(x)\) er implementert.

Kvantil

Det er vanlig å betegne \((1-\alpha)\)-kvantilen i en kjikvadratfordeling med \(\nu\) frihetsgrader med \(\chi^2_{\alpha,\nu}.\) Denne kvantilen, \(\chi^2_{\alpha,\nu},\) kan man i prinsippet finne ved å løse ligningen \(F(\chi^2_{\alpha,\nu})=1-\alpha\) med hensyn på \(\chi^2_{\alpha,\nu}.\) Denne ligningen har dog ingen enkel analytisk form, så for å finne en verdi for \(\chi^2_{\alpha,\nu}\) har man to muligheter.

  • Man kan benytte et dataprogram der utregning av kvantiler er implementert.
  • Man kan benytte en statistisk tabell hvor kvantiler i kjikvadratfordelinger er tabulert.

Sammenheng med andre fordelinger

Det finnes sammenhenger mellom kjikvadratfordeling og en del andre fordelinger. Disse sammenhengene diskuteres på følgende temasider: