Processing math: 100%

Inferens for regresjonsparametrene

Når vi skal utlede et konfidensintervall eller bestemme oss for en testobservator i en hypotesetestsituasjon må vi ta utgangspunkt i en størrelse som kun er en funksjon av de stokastiske variablene og den parameteren man skal lage konfidensintervall for eller gjøre hypotesetest om. I en regresjonsmodell er det mest aktuelt å gjøre inferens (utlede konfidensintervall eller utføre en hypotesetest) om β0 og β1, og vanligvis vil da variansen σ2 også ha en ukjent verdi. Vi vil derfor her kun se på hvilke størrelser man tar utgangspunkt i for å gjøre inferens i en slik situasjon. Vi diskuterer først for β1 og deretter for β0.

Inferens om β1

Da vi studerte egenskaper til regresjonsestimatorene fant vi at ˆβ1N(β1,σ2ni=1(xiˉx)2). Den tilhørende standardiserte variabelen blir dermed Z=ˆβ1β1σ2ni=1(xiˉx)2N(0,1). Dersom variansen σ2 har en kjent verdi kan man ta utgangspunkt i Z for å utlede konfidensintervall eller konstruere en hypotesetest for β1. Mer typisk er det at verdien til σ2 også er ukjent og da vil man erstatte σ2 i utrykket for Z med den tilhørende forventningsrette estimatoren S2=1n2ni=1(Yiˆβ0ˆβ1xi)2. Man vil dermed ta utgangspunkt i T=ˆβ1β1S2ni=1(xiˉx)2 som blir T-fordelt med n2 frihetsgrader. For å se at T blir T-fordelt med det spesifiserte antall frihetsgrader må man observere at den kan skrives på formen T=ˆβ1β1S2ni=1(xiˉx)2=ˆβ1β1σ2ni=1(xiˉx)2(n2)S2σ2n2=ZVn2. Her er Z som definert over slik at vi har ZN(0,1), mens V=(n2)S2σ2. Da vi studerte egenskaper til regresjonsparametrene fant vi nesten helt nederst på temasiden at (n2)S2σ2χ2n2, så dermed har vi at Vχ2n2. På temasiden hvor vi diskuterte egenskaper til regresjonsparametrene fant vi også at ˆβ1 og S2 var uavhengige stokastiske variabler. Siden Z kun er en funksjon av ˆβ1, mens V kun er en funksjon av S2 får vi da at Z og V også er uavhengige stokastiske variabler. Fra definisjonen av en T-fordeling har vi da at Ttn2, dvs ˆβ1β1S2ni=1(xiˉx)2tn2. Ut fra dette kan man utlede konfidensintervall for β1 og konstruere hypotesetester for β1 ved å følge enten regneprosedyre for å utlede konfidensintervall eller regneprosedyre for å utlede hypotesetest (TODO: sette inn link her).

Inferens om β0

For å etablere hvilken størrelse man bør ta utgangspunkt i for å gjøre inferens om β0 kan vi gå frem helt tilsvarende som forklart for β1 over.

Da vi studerte egenskaper til regresjonsestimatorene fant vi at ˆβ0N(β0,σ2ni=1x2inni=1(xiˉx)2). Den tilhørende standardiserte variabelen blir dermed Z=ˆβ0β0σ2ni=1x2inni=1(xiˉx)2N(0,1). Dersom variansen σ2 har en kjent verdi kan man ta utgangspunkt i Z for å utlede konfidensintervall eller konstruere en hypotesetest for β0. Mer typisk er det at verdien til σ2 også er ukjent og da vil man erstatte σ2 i utrykket for Z med den tilhørende forventningsrette estimatoren S2=1n2ni=1(Yiˆβ0ˆβ1xi)2. Man vil dermed ta utgangspunkt i T=ˆβ0β0S2ni=1x2inni=1(xiˉx)2 som blir T-fordelt med n2 frihetsgrader. For å se at T blir T-fordelt med det spesifiserte antall frihetsgrader må man observere at den kan skrives på formen T=ˆβ0β0S2ni=1x2inni=1(xiˉx)2=ˆβ0β0σ2ni=1x2inni=1(xiˉx)2(n2)S2σ2n2=ZVn2. Her er Z som definert over slik at vi har ZN(0,1), mens V=(n2)S2σ2. Da vi studerte egenskaper til regresjonsparametrene fant vi nesten helt nederst på temasiden at (n2)S2σ2χ2n2, så dermed har vi at Vχ2n2. På temasiden hvor vi diskuterte egenskaper til regresjonsparametrene fant vi også at ˆβ0 og S2 var uavhengige stokastiske variabler. Siden Z kun er en funksjon av ˆβ0, mens V kun er en funksjon av S2 får vi da at Z og V også er uavhengige stokastiske variabler. Fra definisjonen av en T-fordeling har vi da at Ttn2, dvs ˆβ0β0S2ni=1x2inni=1(xiˉx)2tn2. Ut fra dette kan man utlede konfidensintervall for β0 og konstruere hypotesetester for β0 ved å følge enten regneprosedyre for å utlede konfidensintervall eller regneprosedyre for å utlede hypotesetest (TODO: sette inn link her).