Regneprosedyre: p-verdi-metoden

Regneregel

På temasidene «Hypotese», «Type I-feil og type II-feil», «Testobservator», «Signifikansnivå og beslutningsregel» og «p-verdi» definerer og diskuterer vi viktige begreper i forbindelse med hypotesetesting. På temasiden du ser på nå oppsummerer vi det hele til en beregningsprosedyre som man kan bruke når en skal utføre en hypotesetest. Prosedyren vi formulerer her kalles gjerne p-verdi-metoden. Det finnes også en alternativ prosedyre man kan benytte, den prosedyren kalles forkastningsområdemetoden og er formulert på en egen temaside.

Situasjon

Anta at vi har uavhengige stokastiske variabler \(X_1,X_2,\ldots,X_n\) der \(X_i\sim f_{X_i}(x_i;\theta)\) for \(i=1,2,\ldots,n,\) der verdien til parameteren \(\theta\) er ukjent. Anta videre at vi har observert verdier \(x_1,x_2,\ldots,x_n\) for de stokastiske variablene \(X_1,X_2,\ldots,X_n\) og vi ønsker nå å benytte disse observerte verdiene til å teste om det er grunnlag for en angitt påstand om verdien til \(\theta.\) Kanskje har vi også valgt eller er gitt hvilket signifikansnivå \(\alpha\) vi skal bruke i hypotesetesten.

Beregningsprosedyre

P-verdi-metoden kan utføres ved følgende prosedyre.

  1. Velg nullhypotese \(H_0\) og alternativ hypotese \(H_1.\) Start med å velge den alternativ hypotesen \(H_1\) som det man ønsker å undersøke om observasjonene gir grunnlag for å påstå. Velg så \(H_0\) som «det motsatte» av \(H_1,\) der vi skriver det motsatte i hermetegn fordi det er vanlig å benytte likhetstegn til å formulere \(H_0.\) I praksis betyr dette at man har tre muligheter for valg av \(H_1\) og \(H_0.\) For en kjent verdi \(\theta_0\) vil man enten teste a) \(H_0: \theta = \theta_0\) mot \(H_1: \theta > \theta_0,\) eller man vil teste b) \(H_0: \theta=\theta_0\) mot \(H_1: \theta < \theta_0,\) eller man vil teste c) \(H_0: \theta = \theta_0\) mot \(H_1: \theta \neq \theta_0.\)
  2. Velg eller finn en estimator for parameteren \(\theta.\) Videre lar vi denne estimatoren være \(\widehat{\theta}.\)
  3. Velg som testobservator en funksjon av \(\widehat{\theta}\) og \(\theta_0\) slik at denne har en kjent sannsynlighetsfordeling når \(H_0\) er riktig. Videre lar vi her denne testobservatoren være \[T=u(\widehat{\theta},\theta_0).\]
  4. Bestemme type beslutningsregel. Hvordan denne beslutningsregelen blir vil både avhenge av hva man har valgt som \(H_1\) og av om testobservatoren \(T=u(\widehat{\theta},\theta_0)\) er en voksende eller avtagende funksjon av \(\widehat{\theta}.\) Dersom testobservatoren er en voksende funksjon av \(\widehat{\theta}\) vil beslutningsregelen for de tre mulige hypotesene \(H_1\) diskutert i punkt 1 bli henholdsvis a) forkaste \(H_0\) dersom \(T \geq k,\) b) forkaste \(H_0\) dersom \(T \leq k\) og c) forkaste \(H_0\) dersom \(T\leq k_l\) eller \(T\geq k_u,\) der \(k\) eller \(k_l\) og \(k_u\) er kritiske verdier og hvor verdiene til denne eller disse bestemmes i neste punkt. Dersom testobservatoren \(T=u(\widehat{\theta},\theta_0)\) derimot er en avtagende funksjon av \(\widehat{\theta}\) blir beslutningsregelen for de tre mulige hypotesene \(H_1\) i punkt 1 henholdsvis a) forkast \(H_0\) dersom \(T\leq k,\) b) forkast \(H_0\) dersom \(T\geq k\) og c) forkast \(H_0\) dersom \(T\leq k_l\) eller \(T\geq k_u.\)
  5. Regn ut observert verdi for testobservatoren. Dette vil si at man først må erstatte de stokastiske variablene \(X_1,X_2,\ldots,X_n\) i uttrykket man har for estimatoren \(\widehat{\theta}\) med de tilhørende observerte verdiene \(x_1,x_2,\ldots,x_n\) og dermed regne ut et estimat \(\widehat{\theta}\) for \(\theta.\) Deretter setter man dette estimatet inn i uttrykket man har for testobservatoren og regner dermed ut observert verdi \[t_{\tiny \text{obs}} = u(\widehat{\theta},\theta_0).\]
  6. Regn ut p-verdien. Dersom beslutningsregelen bestemt i punkt 4 er at man skal forkaste \(H_0\) dersom \(T \geq k\) er p-verdien gitt ved \(p=P(T\geq t_{\tiny \text{obs}}|H_0)\) og dersom beslutningsregelen er at man skal forkaste \(H_0\) dersom \(T\leq k\) blir p-verdien lik \(p=P(T\leq t_{\tiny \text{obs}}|H_0).\) Dersom man har en tosidig test slik at beslutningsregelen er at man skal forkaste \(H_0\) dersom \(T\leq k_l\) eller \(T\geq k_u\) er uttrykket for p-verdien avhengig av hvordan testobservatoren er definert og hvilke fordeling \(T\) har når \(H_0\) er riktig, så da er det best å ta utgangspunkt i definisjonen av p-verdi.
  7. Dersom vi har valgt eller fått oppgitt et signifikansnivå \(\alpha\) kan vi nå trekke konklusjon. Dersom \(p\leq \alpha\) er konklusjonen å forkaste \(H_0,\) mens hvis \(p>\alpha\) er konklusjonen ikke å forkaste \(H_0.\)

Kommentar

Man bør merke seg at det også finnes en alternativ prosedyre for å utføre en hypotesetest, den såkalte forkastningsområdemetoden. De fire første trinnene i p-verdi-metoden er identisk med prosedyren beskrevet over, men fra og med trinn 5 er de to metodene forskjellige.