Konfidens- og prediksjonsintervall

Anta at vi er interessert i verdien til en ukjent størrelse \(\theta.\) Anta at det ikke er mulig å måle denne størrelsen eksakt, men vi kan gjøre målinger eller observasjoner der verdiene vi observerer avhenger av verdien til \(\theta\). Vi antar at vi innhenter informasjon om verdien til \(\theta\) ved å gjøre \(n\) slike målinger, og lar den stokastiske variabelen \(X_i\) betegne resultatet av måling nummer \(i.\) Vi antar videre at vi gjør målingene på en slik måte at det er rimelig å anta at \(X_1,X_2,\ldots,X_n\) er uavhengige stokastiske variabler og at de alle har samme sannsynlighetsfordeling. Den felles sannsynlighetsfordelingen for \(X_i\)-ene betegner vi med \(f(x;\theta)\). Vi antar at vi kjenner en formel for \(f(x;\theta),\) men at \(\theta\) inngår i denne formelen og verdien til \(\theta\) er som nevnt ukjent. Det å anslå verdien til \(\theta\) ut fra observerte verdier \(x_1,x_2,\ldots,x_n\) for \(X_1,X_2,\ldots,X_n\) kalles parameterestimering. I tillegg til å anslå verdien til \(\theta\) vil man ofte også ønske å si noe om hvor sikker man er på verdien til \(\theta.\) For å gjøre dette er det vanlig å bruke de samme observerte verdiene \(x_1,x_2,\ldots,x_n\) til å konstruere et intervall som i en viss forstand inneholder verdien til \(\theta\) med en spesifisert (høy) sannsynlighet. Et slikt intervall kalles et konfidensintervall. Et konfidensintervall angir dermed hva som er rimelige verdier for \(\theta\) ut fra observasjonene \(x_1,x_2,\ldots,x_n\), og lengden på konfidensintervallet tallfester hvor sikker vi er på verdien til \(\theta.\)

Ut fra de observerte verdiene \(x_1,x_2,\ldots,x_n\) er det også mulig å konstruere et intervall som med en spesifisert (høy) sannsynlighet vil inneholde verdien til en ny observasjon. Et slikt intervall kalles et prediksjonsintervall siden det predikerer (eller forutsier) omtrentlig hva vi vil komme til å observere dersom vi en gang i fremtiden gjør en ny observasjon.