P-verdi

I en hypotesetestingssituasjon er det mye vanlig å regne ut en såkalt p-verdi. En p-verdi angir sannsynligheten for å observere det man har observert eller noe mer ekstremt når hypotesen \(H_0\) er riktig.

P-verdi

Vi angir først en definisjon for begrepet p-verdi og diskuterer etterpå hvordan man best kan forstå definisjonen og hva tolkningen av en p-verdi er.

Notasjon

Det er vanlig å betegne p-verdien med bokstaven \(p.\)

Kommentar

Det er lettest å forstå definisjonen over dersom vi først innfører litt mer notasjon. La nullhypotesen være at \(H_0: \theta = \theta_0,\) la \(X_1,X_2,\ldots,X_n\) være de relevante stokastiske variablene, og la \(T=u(X_1,X_2,\ldots,X_n,\theta_0)\) betegne testobservatoren vi har valgt å benytte. Anta så at vi har observert verdier \(x_1,x_2,\ldots,x_n\) for de stokastiske variablene \(X_1,X_2,\ldots,X_n\) slik at observert verdi for testobservatoren er \(t_{\tiny \text{obs}}=u(x_1,x_2,\ldots,x_n,\theta_0).\) Her er altså \(t_{\tiny \text{obs}}\) en tallverdi vi kan regne ut og som i definisjonen over omtales som «den observerte verdien».

Anta så at vi ut fra den spesifiserte alternative hypotesen \(H_1\) og uttrykket for den valgte testobservatoren \(T\) allerede har bestemt oss for hvilken type beslutningsregel man skal bruke for å bestemme om man skal forkaste \(H_0,\) se diskusjon av dette under overskriften «Beslutningsregel» på temasiden «Signifikansnivå og beslutningsregel». Vi har altså enten bestemt at vi skal 1) forkaste \(H_0\) dersom \(T\geq k,\) eller vi har bestemt at vi skal 2) forkaste \(H_0\) dersom \(T\leq k,\) eller vi har bestemt at vi skal 3) forkaste \(H_0\) dersom \(T\leq k_l\) eller \(T\geq k_u.\) La oss her videre anta at vi er i det første tilfellet, slik at vi skal forkaste \(H_0\) dersom \(T\geq k.\) Formuleringen «observere en verdi for testobservatoren som er lik den observerte verdien eller en verdi som er mer ekstrem i retning av den alternative hypotesen» brukt i definisjonen over betyr da «\(T\geq t_{\tiny \text{obs}}\)», slik at p-verdien i dette tilfellet kan skrives som \[p = P(T\geq t_{\tiny \text{obs}} |H_0),\] der «\(|H_0\)» er en kort skrivemåte for «når \(H_0\) er riktig». En illustrasjon av p-verdien i dette tilfellet er vist i figur 1.

Figur 1: Illustrasjon av p-verdi når en stor verdi for testobservatoren \(T\) er en indikasjon på at \(H_1\) er riktig. Den blå kurven er sannsynlighetstettheten til \(T\) når \(H_0\) er sann og p-verdien er lik arealet av området som er farget rødt.

Tolkning av p-verdi

P-verdien er altså lik sannsynligheten for å observere det man har observert eller noe mer ekstremt når \(H_0\) er riktig. Dersom p-verdien er liten er det dermed lite sannsynlig å observere noe så ekstremt som det man har observert når \(H_0\) er riktig, noe som tyder på at \(H_0\) er feil og \(H_1\) er riktig. Motsatt, dersom p-verdien er høy er det høy sannsynlighet for å observere noe så ekstremt som det vi har observert når \(H_0\) er riktig, og det er dermed ingen grunn til å forkaste \(H_0.\)

Dersom vi har valgt et signifikansnivå \(\alpha\) kan vi konkludere med om vi skal forkaste \(H_0\) eller ikke ut fra p-verdien. Dersom \(p\leq \alpha\) skal vi forkaste \(H_0,\) mens hvis \(p > \alpha\) skal vi ikke forkaste \(H_0.\)

Prosedyrer for å utføre en hypotesetest

Det finnes to ofte brukte prosedyrer for å utføre en hypotesetest, forkastningsområdemetoden og p-verdi-metoden. Disse er formulert og diskutert på egne temasider.