Estimator

Når vi har gjort observasjoner på et utvalg ønsker vi ofte å benytte de målte verdiene til å anslå verdien til en parameter \(\theta.\) Vi bruker da de observerte verdiene til å regne ut et tall som er vårt anslag på verdien til \(\theta.\) Matematisk sett vil dette si at de observerte verdiene benyttes som argumenter i en funksjon, der verdien funksjonen får er vårt anslag. En slik funksjon er det sentrale elementet i det vi kaller en estimator.

Estimator

Vi starter med å definere begrepet estimator.

Kommentar til definisjonen

En estimator for \(\theta\) er dermed en funksjon av de stokastiske variablene \(X_1,X_2,\ldots,X_n\). En mye brukt estimator for forventningsverdien \(\mu\) er for eksempel gjennomsnittet \(\frac{1}{n}\sum_{i=1}^n X_i\).

Notasjon

Som symbol for en estimator er det vanlig å sette en hatt over symbolet til den parameteren man ønsker å estimere. Dersom man skal estimere verdien til \(\theta\) kaller man altså den tilhørende estimatoren for \(\hat{\theta}\), som man leser som theta-hatt. Andre notasjoner som noen ganger blir benyttet for en estimator er å sette en tilde eller en stjerne på symbolet for parameteren eller å sette to hatter over symbolet. Dersom man for eksempel har tre estimatorer for verdien til parameteren \(\theta\) kan man kalle disse for henholdsvis \(\hat{\theta}\), \(\tilde{\theta}\) og \(\theta^\star\).

Enda en kommentar til definisjonen

Siden en estimator \(\hat{\theta}\) er en observator, altså en funksjon av stokastiske variabler, blir en estimator en stokastiske variabel. En estimator har dermed alle de egenskaper som stokastiske variabler har. Spesielt vil en estimator ha en sannsynlighetsfordeling, en forventningsverdi og en varians. Det å finne sannsynlighetsfordelingen til en estimator \(\hat{\theta}\) er i noen situasjoner relativt enkelt, mens i andre situasjoner kan det være svært vanskelig. Hvor lett eller vanskelig det er avhenger av hvilken fordeling \(X_i\)-ene har og hvordan \(\hat{\theta}\) er gitt som funksjon av \(X_1,X_2,\ldots,X_n\).

Mer notasjon

Etter at man har observert verdier \(x_1,x_2,\ldots,x_n\) for \(X_1,X_2,\ldots,X_n\) vil man naturlig sette inn disse verdiene i uttrykket for \(\hat{\theta}\) og regne ut en tilhørende tallverdi for \(\hat{\theta}\). Denne verdien kalles et estimat for \(\theta\). Selv om det kan være noe misledende er det mye vanlig å benytte notasjonen \(\hat{\theta}\) også for estimatet for \(\theta\), og dette gjøres på temasidene du nå ser på. Selv om man benytter notasjon \(\hat{\theta}\) både for estimatoren og estimatet er det viktig å skille mellom disse to. Estimatoren er en stokastisk variabel, mens estimatet er et tall. For å understreke forskjellen mellom en estimator og et estimat benytter en del litteratur notasjonen \(\hat{\Theta}\) for estimatoren og \(\hat{\theta}\) for tilhørende estimat.