Inferens for regresjonsparametrene
Når vi skal utlede et konfidensintervall eller bestemme oss for en testobservator i en hypotesetestsituasjon må vi ta utgangspunkt i en størrelse som kun er en funksjon av de stokastiske variablene og den parameteren man skal lage konfidensintervall for eller gjøre hypotesetest om. I en regresjonsmodell er det mest aktuelt å gjøre inferens (utlede konfidensintervall eller utføre en hypotesetest) om β0 og β1, og vanligvis vil da variansen σ2 også ha en ukjent verdi. Vi vil derfor her kun se på hvilke størrelser man tar utgangspunkt i for å gjøre inferens i en slik situasjon. Vi diskuterer først for β1 og deretter for β0.
Inferens om β1
Da vi studerte egenskaper til regresjonsestimatorene fant vi at ˆβ1∼N(β1,σ2∑ni=1(xi−ˉx)2). Den tilhørende standardiserte variabelen blir dermed Z=ˆβ1−β1√σ2∑ni=1(xi−ˉx)2∼N(0,1). Dersom variansen σ2 har en kjent verdi kan man ta utgangspunkt i Z for å utlede konfidensintervall eller konstruere en hypotesetest for β1. Mer typisk er det at verdien til σ2 også er ukjent og da vil man erstatte σ2 i utrykket for Z med den tilhørende forventningsrette estimatoren S2=1n−2n∑i=1(Yi−ˆβ0−ˆβ1xi)2. Man vil dermed ta utgangspunkt i T=ˆβ1−β1√S2∑ni=1(xi−ˉx)2 som blir T-fordelt med n−2 frihetsgrader. For å se at T blir T-fordelt med det spesifiserte antall frihetsgrader må man observere at den kan skrives på formen T=ˆβ1−β1√S2∑ni=1(xi−ˉx)2=ˆβ1−β1√σ2∑ni=1(xi−ˉx)2√(n−2)S2σ2n−2=Z√Vn−2. Her er Z som definert over slik at vi har Z∼N(0,1), mens V=(n−2)S2σ2. Da vi studerte egenskaper til regresjonsparametrene fant vi nesten helt nederst på temasiden at (n−2)S2σ2∼χ2n−2, så dermed har vi at V∼χ2n−2. På temasiden hvor vi diskuterte egenskaper til regresjonsparametrene fant vi også at ˆβ1 og S2 var uavhengige stokastiske variabler. Siden Z kun er en funksjon av ˆβ1, mens V kun er en funksjon av S2 får vi da at Z og V også er uavhengige stokastiske variabler. Fra definisjonen av en T-fordeling har vi da at T∼tn−2, dvs ˆβ1−β1√S2∑ni=1(xi−ˉx)2∼tn−2. Ut fra dette kan man utlede konfidensintervall for β1 og konstruere hypotesetester for β1 ved å følge enten regneprosedyre for å utlede konfidensintervall eller regneprosedyre for å utlede hypotesetest (TODO: sette inn link her).
Inferens om β0
For å etablere hvilken størrelse man bør ta utgangspunkt i for å gjøre inferens om β0 kan vi gå frem helt tilsvarende som forklart for β1 over.
Da vi studerte egenskaper til regresjonsestimatorene fant vi at ˆβ0∼N(β0,σ2∑ni=1x2in∑ni=1(xi−ˉx)2). Den tilhørende standardiserte variabelen blir dermed Z=ˆβ0−β0√σ2∑ni=1x2in∑ni=1(xi−ˉx)2∼N(0,1). Dersom variansen σ2 har en kjent verdi kan man ta utgangspunkt i Z for å utlede konfidensintervall eller konstruere en hypotesetest for β0. Mer typisk er det at verdien til σ2 også er ukjent og da vil man erstatte σ2 i utrykket for Z med den tilhørende forventningsrette estimatoren S2=1n−2n∑i=1(Yi−ˆβ0−ˆβ1xi)2. Man vil dermed ta utgangspunkt i T=ˆβ0−β0√S2∑ni=1x2in∑ni=1(xi−ˉx)2 som blir T-fordelt med n−2 frihetsgrader. For å se at T blir T-fordelt med det spesifiserte antall frihetsgrader må man observere at den kan skrives på formen T=ˆβ0−β0√S2∑ni=1x2in∑ni=1(xi−ˉx)2=ˆβ0−β0√σ2∑ni=1x2in∑ni=1(xi−ˉx)2√(n−2)S2σ2n−2=Z√Vn−2. Her er Z som definert over slik at vi har Z∼N(0,1), mens V=(n−2)S2σ2. Da vi studerte egenskaper til regresjonsparametrene fant vi nesten helt nederst på temasiden at (n−2)S2σ2∼χ2n−2, så dermed har vi at V∼χ2n−2. På temasiden hvor vi diskuterte egenskaper til regresjonsparametrene fant vi også at ˆβ0 og S2 var uavhengige stokastiske variabler. Siden Z kun er en funksjon av ˆβ0, mens V kun er en funksjon av S2 får vi da at Z og V også er uavhengige stokastiske variabler. Fra definisjonen av en T-fordeling har vi da at T∼tn−2, dvs ˆβ0−β0√S2∑ni=1x2in∑ni=1(xi−ˉx)2∼tn−2. Ut fra dette kan man utlede konfidensintervall for β0 og konstruere hypotesetester for β0 ved å følge enten regneprosedyre for å utlede konfidensintervall eller regneprosedyre for å utlede hypotesetest (TODO: sette inn link her).