Konfidens- og prediksjonsintervall

Anta at vi er interessert i verdien til en ukjent størrelse θ. Anta at det ikke er mulig å måle denne størrelsen eksakt, men vi kan gjøre målinger eller observasjoner der verdiene vi observerer avhenger av verdien til θ. Vi antar at vi innhenter informasjon om verdien til θ ved å gjøre n slike målinger, og lar den stokastiske variabelen Xi betegne resultatet av måling nummer i. Vi antar videre at vi gjør målingene på en slik måte at det er rimelig å anta at X1,X2,,Xn er uavhengige stokastiske variabler og at de alle har samme sannsynlighetsfordeling. Den felles sannsynlighetsfordelingen for Xi-ene betegner vi med f(x;θ). Vi antar at vi kjenner en formel for f(x;θ), men at θ inngår i denne formelen og verdien til θ er som nevnt ukjent. Det å anslå verdien til θ ut fra observerte verdier x1,x2,,xn for X1,X2,,Xn kalles parameterestimering. I tillegg til å anslå verdien til θ vil man ofte også ønske å si noe om hvor sikker man er på verdien til θ. For å gjøre dette er det vanlig å bruke de samme observerte verdiene x1,x2,,xn til å konstruere et intervall som i en viss forstand inneholder verdien til θ med en spesifisert (høy) sannsynlighet. Et slikt intervall kalles et konfidensintervall. Et konfidensintervall angir dermed hva som er rimelige verdier for θ ut fra observasjonene x1,x2,,xn, og lengden på konfidensintervallet tallfester hvor sikker vi er på verdien til θ.

Ut fra de observerte verdiene x1,x2,,xn er det også mulig å konstruere et intervall som med en spesifisert (høy) sannsynlighet vil inneholde verdien til en ny observasjon. Et slikt intervall kalles et prediksjonsintervall siden det predikerer (eller forutsier) omtrentlig hva vi vil komme til å observere dersom vi en gang i fremtiden gjør en ny observasjon.