Utlede konfidensintervall for \(\mu\) i normalfordeling, kjent varians
Eksempel
Vi har formulert en generell regneprosedyre for å finne et konfidensintervall i en gitt situasjon. På siden du ser på nå anvendes denne prosedyren for å bestemme et konfidensintervall for \(\mu\) i en normalfordeling når variansen \(\sigma^2\) har en kjent verdi. Detaljerte utregninger vises skritt for skritt slik de er beskrevet i den generelle regneprosedyren.
Utlede konfidensintervall for \(\mu\) i normalfordeling, kjent varians
Anta at \(X_1,X_2,\ldots,X_n\) er et tilfeldig utvalg fra en \(n(x;\mu,\sigma)\)-fordeling der verdien til forventningsverdien \(\mu\) er ukjent, mens verdien til variansen \(\sigma^2\) er kjent. Vi skal utlede en formel for et \(95\%\)-konfidensintervall for \(\mu\). Forventningsverdien \(\mu\) spiller her altså samme rolle som \(\theta\) i den generelle prosedyren.
- For å finne en stokastisk variabel \(Z=h(X_1,X_2,\ldots,X_n,\mu)\) med de riktige egenskapene starter vi med en estimator for \(\mu\). En vanlig estimator for \(\mu\) er \[ \widehat{\mu} = \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i.\] Siden \(\widehat{\mu}\) er en lineærkombinasjon av de uavhengige og normalfordelte \(X_1,X_2,\ldots,X_n\) blir også \(\widehat{\mu}\) normalfordelt. Forventningsverdi til \(\widehat{\mu}\) finner man ved å benytte regneregler for forventningsverdi til en lineær funksjon, \[\begin{align}\mbox{E}\!\left[\widehat{\mu}\right] &= \mbox{E}\!\left[\frac{1}{n}\sum_{i=1}^nX_i\right]\\ &= \frac{1}{n} \mbox{E}\!\left[\sum_{i=1}^nX_i\right]\\ &= \frac{1}{n} \sum_{i=1}^n \mbox{E}\!\left[X_i\right]\\ &= \frac{1}{n} \sum_{i=1}^n \mu\\ &= \frac{1}{n}\cdot n\mu\\ &= \mu.\end{align}\] Variensen til \(\widehat{\mu}\) finner man tilsvarende ved å benytte regneregler for varians til en lineær funksjon, \[\begin{align}\mbox{Var}\!\left[\widehat{\mu}\right] &=\mbox{Var}\!\left[ \frac{1}{n}\sum_{i=1}^n X_i\right]\\ &= \left(\frac{1}{n}\right)^2 \mbox{Var}\!\left[\sum_{i=1}^n X_i\right]\\ &= \frac{1}{n^2} \sum_{i=1}^n\mbox{Var}\!\left[X_i\right]\\ &= \frac{1}{n^2} \sum_{i=1}^n\sigma^2\\ &= \frac{1}{n^2} \cdot n\sigma^2\\ &= \frac{\sigma^2}{n},\end{align}\] der vi har benyttet at \(X_i\)-ene er uavhengige. Vi har dermed at \[ \widehat{\mu} = \bar{X} \sim n\left(\bar{x};\mu,\sqrt{\frac{\sigma^2}{n}}\right).\] Vi kan så standardisere \(\widehat{\mu}=\bar{X}\) ved å trekke fra forventningsverdien til \(\widehat{\mu}\) og dele på standardavviket til \(\widehat{\mu}\) og får da en størrelse som er standard normalfordelt, \[ Z = \frac{\widehat{\mu}-\mbox{E}\left[\widehat{\mu}\right]}{\sqrt{\mbox{Var}\left[\widehat{\mu}\right]}} = \frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} \sim n(z;0,1).\] Merk at siden vi har antatt at verdien til variansen \(\sigma^2\) er kjent er det greit at \(\sigma^2\) inngår i uttrykket for \(Z\).
- Siden vi skal finne et \(95\%\)-konfidensintervall er \(\alpha=0.05\), og siden sannsynlighetstettheten til en standard normalfordeling er symmetrisk om \(z=0\) er \(z_{1-\frac{\alpha}{2}}=-z_{\frac{\alpha}{2}}\), som illustrert i figur 1. Fra en tabell over kvantiler i en standard normalfordeling finner vi at \(z_{\frac{\alpha}{2}}=z_{0.025} = 1.96\), og vi har \[ P\left(-z_{\frac{\alpha}{2}} \leq \frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} \leq z_{\frac{\alpha}{2}}\right) = 1-\alpha.\]
- Vi må dermed løse ulikehetene \[ -z_{\frac{\alpha}{2}} \leq \frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} ~~~~~~\mbox{og}~~~~~~\frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} \leq z_{\frac{\alpha}{2}}\] hver for seg med hensyn på \(\mu\). Den første ulikheten gir \[\begin{align} -z_{\frac{\alpha}{2}} &\leq \frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\\-z_{\frac{\alpha}{2}} \sqrt{\frac{\sigma^2}{n}} &\leq \bar{X}-\mu\\-\bar{X}-z_{\frac{\alpha}{2}} \sqrt{\frac{\sigma^2}{n}} &\leq -\mu\\ \bar{X}+z_{\frac{\alpha}{2}} \sqrt{\frac{\sigma^2}{n}} &\geq \mu,\end{align}\] der vi snudde ulikhetstegnet i den siste overgangen når vi ganget med \(-1\) på begge sider av ulikhetstegnet. Den andre ulikheten gir tilsvarende \[\begin{align}\frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} &\leq z_{\frac{\alpha}{2}}\\ \bar{X}-\mu &\leq z_{\frac{\alpha}{2}} \sqrt{\frac{\sigma^2}{n}}\\ -\mu &\leq - \bar{X} + z_{\frac{\alpha}{2}} \sqrt{\frac{\sigma^2}{n}}\\ \mu &\geq \bar{X} - z_{\frac{\alpha}{2}} \sqrt{\frac{\sigma^2}{n}}.\end{align}\] Setter vi de to ulikhetene sammen igjen med den ukjente \(\mu\) i midten får vi \[\begin{align} &P\left( \bar{X}-z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma^2}{n}} \leq \mu\leq \bar{X}+z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma^2}{n}} \right) = 1-\alpha,\end{align}\] slik at intervallestimatoren blir \[ \left[ \bar{X}-z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma^2}{n}}, \bar{X}+z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma^2}{n}}\right].\]
- Vi får da konfidensintervallet ved å erstatte de stokastiske variablene \(X_1,X_2,\ldots,X_n\) med de observerte verdiene \(x_1,x_2,\ldots,x_n\), dvs vi må erstatte \(\bar{X}=\frac{1}{n}\sum_{i=1}^nX_i\) med \(\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i\) i intervallestimatoren. Konfidensintervallet blir dermed \[ \left[ \bar{x}-z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma^2}{n}}, \bar{x}+z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma^2}{n}}\right],\] der vi husker at \(z_{\frac{\alpha}{2}}=z_{0.025}=1.96\) siden vi skal ha et \(95\%\)-konfidensintervall.