Signifikansnivå og beslutningsregel

Vi skal nå anta at vi er i en hypotesetestingssituasjon, at vi har formulert hypoteser \(H_0\) og \(H_1\) og at vi har valgt en passende testobservator \(T.\) Hvordan skal vi da avgjøre om vi skal forkaste \(H_0\) eller ikke forkaste \(H_0\)? På temasiden du ser på nå diskuterer vi hvordan man kan konstruere en forkastningsregel og hvordan denne forkastningsregelen avhenger av et signifikansnivå.

Signifikansnivå

Vi starter med å definere hva vi skal mene med signifikansnivået til en hypotesetest og diskuterer etterpå hvordan man bruker signifikansnivået til å bestemme en beslutningsregel.

Notasjon

Det er vanlig å betegne signifikansnivået med den greske bokstaven \(\alpha.\) Man kan dermed skrive \[\alpha = P(\text{forkaste \(H_0\) når \(H_0\) er riktig}).\] Det er også mye vanlig å skrive dette som \[\alpha=P(\text{forkaste \(H_0\)}|\text{H_0}),\] der «\(| H_0\)» altså er en kort skrivemåte for «når \(H_0\) er riktig». Det er viktig ikke å tolke skrivemåten over som en betinget sannsynlighet. Notasjonen over er tilsynelatende den samme som benyttes for betinget sannsynlighet, men skal huske at nullhypotesen \(H_0\) ikke er en hendelse.

Beslutningsregel

Når man i en hypotesetestingssituasjon har valgt en testobservator \(T\) og ønsker å formulere en beslutningsregel for når man skal forkaste \(H_0,\) må man starte med å finne ut hva som skjer med testobservatoren når \(H_1\) er riktig. Er det for eksempel slik at \(T\) vil tendere til å være større når \(H_1\) er riktig enn når \(H_0\) er riktig? I så fall vil en stor verdi for \(T\) være en indikasjon på at \(H_0\) er feil og det er dermed rimelig å forkaste \(H_0\) dersom \(T\) er stor nok. For en verdi \(k,\) som må bestemmes, er det altså rimelig å forkaste \(H_0\) dersom \(T\geq k.\) Dersom det motsatt tilfellet, at \(T\) tenderer til å være mindre når \(H_1\) er riktig enn når \(H_0\) er det en liten verdi for \(T\) som vil indikere at \(H_0\) er feil. Da er det rimelig å forkaste \(H_0\) dersom \(T\leq k,\) for en passende verdi \(k.\) Det finnes også situasjoner hvor både en stor verdi og en liten verdi for \(T\) indikerer at \(H_0\) er feil. Dette er spesielt aktuelt hvis man har en tosidig test. I så tilfelle vil det være rimelig å bestemme to verdier \(k_l\) og \(k_u\) og benytte at man skal forkaste \(H_0\) dersom \(T\leq k_l\) eller \(T\geq k_u.\)

Verdien til \(k,\) eventuelt verdiene til \(k_l\) og \(k_u,\) kalles en kritisk verdi, og verdiene for \(T\) hvor man skal forkaste \(H_0\) kalles forkastningsområdet. Dersom man for eksempel forkaster \(H_0\) dersom \(T\geq k\) blir forkastningsområdet \([k,\infty).\)

Bestemme kritisk verdi

Anta at man nå har bestemt at man skal forkaste \(H_0\) dersom \(T\geq k,\) eller at man skal forkaste \(H_0\) dersom \(T\leq k,\) eller at man skal forkaste \(H_0\) dersom \(T\leq k_l\) eller \(T\geq k_u.\) Neste skritt er da å bestemme verdien til den kritiske verdien \(k,\) eventuelt verdiene til de kritiske verdiene \(k_l\) og \(k_u.\) Dette er det vanlig å gjøre ved å velge en verdi for signifikansnivået \(\alpha\) og så bestemme \(k,\) eventuelt \(k_l\) og \(k_u,\) slik at \[P(\text{forkast \(H_0\)|\(H_0\)})\leq \alpha,\] samtidig som at sannsynligheten i ligningen over blir så nær \(\alpha\) som mulig. Dersom testobservatoren er en kontinuerlig stokastisk variabel er det alltid mulig oppnå likhet i ligningen over slik at man i stedet kan bruke kravet \[P(\text{forkast \(H_0\)|\(H_0\)}) =\alpha\] til å bestemme den eller de kritiske verdiene. Dersom \(T\) derimot er en diskret stokastisk variabel vil det typisk ikke være mulig å oppnå likhet og man må ta utgangspunkt i utrykket med ulikhet.

Prosedyrer for å utføre en hypotesetest

Det finnes to ofte brukte prosedyrer for å utføre en hypotesetest, forkastningsområdemetoden og p-verdi-metoden. Disse er formulert og diskutert på egne temasider.