Konfidensintervall

På temasiden du ser på nå finner du en definisjon av konfidensintervall og en del diskusjon rundt denne definisjonen. På to relaterte temasider diskuteres henholdvis hvordan man kan beregne et konfidensintervall og hvilken tolkning et konfidensintervall har. Det finnes ulike innganger for å få en god forståelse av begrepet konfidensintervall. Man kan starte med å studere definisjonen som gis på temasiden du ser på nå, men mange vil nok oppfatte dette som litt abstrakt og kanskje noe vanskelig. En alternativ inngang til begrepet konfidensintervall er å starte med å studere et eksempel på utregning av et konfidensintervall. Etter å ha studert dette vil man være bedre rustet til å forstå den formelle definisjonen av konfidensintervall som vi diskuterer på temasiden du nå ser på.

Konfidensintervall

Vi starter med å gi en formell definisjon av hva et konfidensintervall er.

Konfidensintervall

Anta at vi har stokastiske variabler \(X_1,X_2,\ldots,X_n\) der sannsynlighetsfordelingen for disse inneholder en parameter \(\theta,\) og der verdien til parameteren \(\theta\) er ukjent. La \(x_1,x_2,\ldots,x_n\) betegne observerte verdier for de stokastiske variablene \(X_1,X_2,\ldots,X_n\). Anta videre at man for to observatorer \(\widehat{\theta}_L(X_1,X_2,\ldots,X_n)\) og \(\widehat{\theta}_U(X_1,X_2,\ldots,X_n)\) har at

\[ P\left(\widehat{\theta}_L(X_1,X_2,\ldots,X_n) \leq \theta \leq \widehat{\theta}_U(X_1,X_2,\ldots,X_n)\right) = 1 - \alpha, \]

der \(\alpha \in (0,1)\). Det numeriske intervallet \[\left[\widehat{\theta}_L(x_1,x_2,\ldots,x_n),\widehat{\theta}_U(x_1,x_2,\ldots,x_n)\right]\] kalles da et \((1-\alpha)\cdot 100\%\)-konfidensintervall for \(\theta\).

Kommentarer

Typiske verdier for \(\alpha\) er \(0.05\), \(0.10\) og \(0.01\). Verdien \(1-\alpha\) kalles konfidenskoeffisienten til intervallet. Hvis for eksempel \(\alpha=0.05\) sier vi at vi har et \(95\%\)-konfidensintervall.

I definisjonen over er \(\widehat{\theta}_L(X_1,X_2,\ldots,X_n)\) og \(\widehat{\theta}_U(X_1,X_2,\ldots,X_n)\) antatt å være observatorer. Dette innebærer at disse skal være observerbare, slik at når man har observert tallverdier \(x_1,x_2,\ldots,x_n\) for de stokastiske variablene \(X_1,X_2,\ldots,X_n\) skal man være i stand til å regne ut tallverdier for \(\widehat{\theta}_L(x_1,x_2,\ldots,x_n)\) og \(\widehat{\theta}_U(x_1,x_2,\ldots,x_n)\). Som for alle observatorer, kan dermed disse to observatorene ikke være funksjoner av parametre som man ikke kjenner verdien til.

\(\widehat{\theta}_L\) og \(\widehat{\theta}_U\) er funksjoner av \(n\) variabler og vil typisk være definert ved formler. Hvis vi setter inn de stokastiske variablene \(X_1,X_2,\ldots,X_n\) i disse funksjonene blir resultatet stokastiske variabler, mens hvis vi i stedet setter inn de observerte tallene \(x_1,x_2,\ldots,x_n\) får vi tall som resultat.

Et konfidensintervall er altså et numerisk intervall, så grensene i konfidensintervallet er tall. Konfidensintervallet må ikke forveksles med \[\left[\widehat{\theta}_L(X_1,X_2,\ldots,X_n),\widehat{\theta}_U(X_1,X_2,\ldots,X_n)\right],\] der grensene er observatorer (og dermed stokastiske variabler) og kalles ofte en intervallestimator. Forskjellen mellom et konfidensintervall og tilhørende intervallestimator er tilsvarende som forskjellen mellom et estimat og en estimator. En estimator er en stokastisk variabel og en intervallestimator er et intervall der nedre og øvre grense er stokastiske variabler, mens et estimat er et tall og et konfidensintervall er et intervall der nedre og øvre grense er tall. For å gjøre analogien til en estimator og et estimat klarere, bruker en del tekster å kalle et konfidensintervall for et intervallestimat.

Noe som kan gjøre det ekstra komplisert å holde et klart skille mellom et konfidensintervall og tilhørende intervallestimator er at en del tekster (inkludert en del tidligere eksamensoppgaver) ikke skiller klart mellom de to og omtaler begge som konfidensintervall.

Tolkning av konfidensintervall

For å gi en korrekt tolkning av et konfidensintervall må man ta utgangspunkt i sannsynlighetsuttrykket

\[ P\left(\widehat{\theta}_L(X_1,X_2,\ldots,X_n) \leq \theta \leq \widehat{\theta}_U(X_1,X_2,\ldots,X_n)\right) = 1 - \alpha, \]

og kombinere dette med vår tolkning av sannsynlighet. En nærmere diskusjon av dette er gitt på en egen temaside.

Utregning av et konfidensintervall

For å regne ut et konfidensintervall må man først finne formler for observatorer \(\widehat{\theta}_L(X_1,X_2,\ldots,X_n)\) og \(\widehat{\theta}_U(X_1,X_2,\ldots,X_n)\) slik at

\[ P\left(\widehat{\theta}_L(X_1,X_2,\ldots,X_n) \leq \theta \leq \widehat{\theta}_U(X_1,X_2,\ldots,X_n)\right) = 1 - \alpha. \]

Deretter finner man konfidensintervallet ved å erstatte de stokastiske variablene \(X_1,X_2,\ldots,X_n\) med de observerte verdiene \(x_1,x_2,\ldots,x_n\) i formlene for disse to observatorene. En trinn-for-trinn beskrivelse av denne regneprosedyren er diskutert på en egen temaside.