T-fordeling

T-fordelingen er en fordeling som er helt sentral i forbindelse med konstruksjon av konfidensintervall og hypotesetester. T-fordelingen kalles også ofte for Student t-fordeling.

T-fordeling

Vi starter med å definere T-fordelingen ved å angi hvordan man kan konstruere en variabel med denne fordelingen ut fra to uavhengige variabler som er henholdsvis standard normalfordelt og kjikvadratfordelt.

Kommentar

T-fordelingen har altså en parameter, som vanligvis betegnes med den greske bokstaven \(\nu.\) Som angitt i definisjonen er det vanlig å kalle \(\nu\) for «antall frihetsgrader». Grunnen til at \(\nu\) kalles dette er at den tilsvarende parameteren i en kjikvadratfordeling kalles det samme.

Notasjon

For å spesifisere at en stokastisk variabel \(X\) er T-fordelt med \(\nu\) frihetsgrader er det vanlig å skrive \(T\sim t_\nu.\) En stokastisk variabel som er T-fordelt betegnes som oftest med bokstaven \(T,\) eventuelt med en indeks dersom man har flere variabler som er T-fordelt.

Eksempler på sannsynlighetstetthet

Figur 1 viser sannsynlighetstettheter for fire T-fordelinger. Tettheten vises i rødt for antall frihetsgrader lik \(\nu=1,\) i blått for \(\nu=3,\) i grønt for \(\nu=10\) og i brunt for \(\nu=30.\) For å kunne sammenligne er sannsynlighetstettheten i en standard normalfordeling tegnet inn i svart. Merk at forskjellen mellom tetthetene i en T-fordeling med \(\nu=30\) frihetsgrader og i en standard normalfordeling er svært liten, så dersom du har en liten skjerm må du kanskje zoome for å skille de fra hverandre.

Figur 1: Sannsynlighetstettheter \(f(x)\) for en T-fordelinger med \(\nu=1\) i rødt, med \(\nu=3\) i blått, med \(\nu=10\) ii grønt, og med \(\nu=30\) i brunt. Sannsynlighetstettheten for en standard normalfordeling er vist i svart.

Kumulativ fordelingsfunksjon

Kumulativ fordelingsfunksjon kan finnes ved å benytte generell sammenheng mellom \(f(x)\) og \(F(x).\) Her får vi

\[ F(t) = \int_{-\infty}^t \frac{\Gamma\left( \frac{\nu+1}{2}\right)}{\Gamma\left(\frac{\nu}{2}\right)\sqrt{\pi \nu}}\left( 1 + \frac{x^2}{\nu}\right)^{-\frac{\nu+1}{2}}\text{d}x. \]

Dette integralet kan ikke skrives på en enkel analytisk form for alle verdier av \(\nu.\) Det er relativt sjelden man har behov for å evaluere \(F(x)\) i en T-fordeling, men hvis man likevel kommer i en situasjon hvor man har behov for dette bør man benytte et dataprogram der evaluering av \(F(x)\) er implementert.

Kvantil

Det er vanlig å betegne \((1-\alpha)\)-kvantilen i en T-fordeling med \(\nu\) frihetsgrader med \(t_{\alpha,\nu}.\) Denne kvantilen, \(t_{\alpha,\nu},\) kan man i prinsippet finne ved å løse ligningen \(F(t_{\alpha,\nu})=1-\alpha\) med hensyn på \(t_{\alpha,\nu}.\) Denne ligningen har dog ingen enkel analytisk form, så for å finne en verdi for \(t_{\alpha,\nu}\) har man to muligheter.

  • Man kan benytte et dataprogram der utregning av kvantiler er implementert.
  • Man kan benytte en statistisk tabell hvor kvantiler i T-fordelinger er tabulert.

Man bør merke seg at siden sannsynlighetsfordelingen for en T-fordeling er symmetrisk omkring \(0\) får man at \[t_{1-\alpha,\nu}=-t_{\alpha,\nu}.\]

Sammenheng med andre fordelinger

Bortsett fra sammenhengen med standard normal- og kjikvadratfordelingene gitt fra definisjonen av en T-fordeling, diskuterer vi i TMA4240/TMA4245 ingen sammenheng mellom T-fordelingen og andre fordelinger.