Parameterestimering

Anta at vi er vi interessert i å anslå verdien av en ukjent størrelse \(\theta\). Vi skal anta at det ikke er mulig å måle eller observere verdien av \(\theta\) eksakt, men at det er mulig å gjøre målinger eller observasjoner der verdiene vi observerer avhenger av \(\theta\). Mer spesifikt skal vi anta at vi gjør \(n\) slike målinger eller observasjoner, og at resultatet av måling eller observasjon nummer \(i\) kan oppfattes som en stokastisk variabel \(X_i\). Vi skal videre forutsette at vi ut fra vår forståelse av fenomenet vi gjør målingene på eller ut fra måten vi gjør målingene vet hvilken type sannsynlighetsfordeling \(X_i\) har og at \(\theta\) inngår som en parameter i denne fordelingen. Vi skal dessuten anta at vi gjør målingene eller observasjonene på en sånn måte at det er rimelig å betrakte \(X_1,X_2,\ldots,X_n\) som uavhengige stokastiske variabler, og at disse \(n\) stokastiske variablene alle har samme sannsynlighetsfordeling, som vi betegner med \(f(x;\theta)\). Vi antar altså at en formel for \(f(x;\theta)\) er kjent, men at \(\theta\) inngår i denne formelen og at verdien til \(\theta\) er ukjent. Vi ønsker så å benytte resultatet av våre målinger eller observasjoner \(X_1,X_2,\ldots,X_n\) til å anslå verdien til \(\theta\). Ofte betegner man et slikt anslag med \(\hat{\theta}\). Her blir altså \(\hat{\theta}\) en funksjon av \(X_1,X_2,\ldots,X_n\), og \(\hat{\theta}\) sies da å være en estimator for \(\theta\). Etter at man har utført målingene eller observasjonene og fått observerte verdier \(x_1,x_2,\ldots,x_n\) for \(X_1,X_2,\ldots,X_n\) vil man sette disse verdiene inn i uttrykket for \(\hat{\theta}\) og få en observert verdi også for \(\hat{\theta}\). Denne observerte verdien for \(\hat{\theta}\) sies å være et estimat for \(\theta\). Hele prosessen med å spesifisere \(\hat{\theta}\) og å sette inn observerte verdier \(x_1,x_2,\ldots,x_n\) kalles parameterestimering.