Minste kvadraters metode

Anta at vi har observasjonspar \((x_i,y_i),i=1,2,\ldots,n\) og at vi antar en enkel lineær regresjonsmodell for disse dataene. Vi ønsker så å benytte de observerte verdiene til å bestemme den linja som passer best til de observerte dataene, dvs vi ønsker å finne estimater \(\widehat{\beta}_0\) og \(\widehat{\beta}_1\) for de to parametrene \(\beta_0\) og \(\beta_1\).

På temasiden du ser på nå diskuterer vi hvordan vi kan gjøre dette ved å benytte minste kvadraters metode. Et alternativ til denne metoden er å benytte sannsynlighetsmaksimeringsprinsippet og dermed regne ut sannsynlighetsmaksimeringsestimatorene.

Minste kvadraters metode

I minste kvadraters metode definerer man en «avstand» mellom observasjonspunktene og den tilpassede, eller estimerte, linja. Man lar så den estimerte linja være den linja som minimerer denne avstanden.

Notasjon

Notasjonen \(\text{SSE}\) definert i teoremet over er en forkortelse for «Sum of Squares of the Errors». På norsk er det vanlig å omtale dette som en kvadratsum.

Illustrasjon av \(\text{SSE}\)

Kriteriet \(\text{SSE}\) som blir benyttet i minste kvadraters metode er illustrert i figur 2, hvor observasjonsparene er vist i rødt, den estimerte regresjonslinja er blå og differensene \(y_i-\widehat{y}_i\) som inngår i uttrykket for \(\text{SSE}\) er vist i grønt.

Figur 1: Illustrasjon av \(y_i-\widehat{y}_i\) som inngår i kriteriet i minste kvadraters metode.

Minste kvadraters estimater

Ved å minimere kvadratsummen \(\text{SSE}\) med hensyn på \(\widehat{\beta}_0\) og \(\widehat{\beta}_1\) finner vi minste kvadratsums estimatorene.

Minste kvadraters estimatorene

Fra minste kvadraters estimatene får vi de tilhørende minste kvadraters estimatorene ved å erstatte de observerte verdier \(y_i\) med tilhørende stokastiske variabler \(Y_i\) i disse uttrykkene, \[\begin{align}\widehat{\beta}_1 &= \frac{\sum_{i=1}^n (x_i-\bar{x})Y_i}{\sum_{i=1}^n (x_i-\bar{x})^2}\\\widehat{\beta}_0 &= \bar{Y} - \widehat{\beta}_1 \bar{x},\end{align}\] der \(\bar{Y}=\frac{1}{n}\sum_{i=1}^n Y_i\). Egenskapene til disse estimatorene blir diskutert på temasiden «Egenskaper til regresjonsestimatorene».