Utgangspunkt for å utlede konfidensintervall i de mest vanlige situasjonene

Regneregel

Når man skal utlede et konfidensintervall må man ta utgangspunkt i en størrelse (ofte kalt pivotal) som kun er funksjon av de stokastiske variablene og den parameteren man skal lage konfidensintervall for, og som dessuten har en kjent sannsynlighetsfordeling. For en nærmere diskusjon av dette se punkt 1 på temasiden hvor man formulerer en regneprosedyre for å utlede et konfidensintervall. Hvordan denne pivotalen velges avhenger av hvilken situasjon man har, dvs hvilke stokastiske variabler man har, hvilke fordeling disse har og hvilken parameter man ønsker konfidensintervall for. Under gis en korfattet oversikt over slike pivotaler for de mest vanlige situasjonene.

Normalfordeling, ett-utvalg

Anta at \(X_1,X_2,\ldots,X_n\) er et tilfeldig utvalg fra \(n(x;\mu,\sigma)\)-populasjonen. Man kan da lage konfidensintervall for \(\mu\) eller \(\sigma^2\) og den andre parameteren kan ha en kjent eller en ukjent verdi.

Konfidensintervall for \(\mu\) når \(\sigma^2\) kjent

For å lage konfidensintervall for \(\mu\) når verdien til \(\sigma^2\) er kjent er det vanlig å ta utgangspunkt i pivotalen \[Z = \frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} \sim n(z;0,1).\]

Man skal merke seg at selv om \(X_1,X_2,\ldots,X_n\) ikke er normalfordelte, men er et tilfeldig utvalg fra en annen fordeling, vil \(Z\) være tilnærmet standard normalfordelt når \(n\) er stor. Dette følger fra sentralgrenseteoremet. Man kan dermed finne et tilnærmet konfidensintervall for \(\mu\) ved å ta utgangspunkt i \(Z\) også i denne situasjonen.

Konfidensintervall for \(\mu\) når \(\sigma^2\) ukjent

For å lage konfidensintervall for \(\mu\) når verdien til \(\sigma^2\) er ukjent er det vanlig å ta utgangspunkt i pivotalen \[T = \frac{\bar{X}-\mu}{\sqrt{\frac{S^2}{n}}} \sim t_{n-1}.\]

Konfidensintervall for \(\sigma^2\) når \(\mu\) kjent

For å lage konfidensintervall for \(\sigma^2\) når verdien til \(\mu\) er kjent er det vanlig å ta utgangspunkt i pivotalen \[V = \frac{1}{\sigma^2}\sum_{i=1}^n \left(X_i-\mu\right)^2 \sim \chi^2_n.\]

Konfidensintervall for \(\sigma^2\) når \(\mu\) ukjent

For å lage konfidensintervall for \(\sigma^2\) når verdien til \(\mu\) er ukjent er det vanlig å ta utgangspunkt i pivotalen \[V = \frac{(n-1)S^2}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^n \left(X_i-\bar{X}\right)^2 \sim \chi^2_{n-1}.\]

Normalfordeling, to uavhengige utvalg

Anta at \(X_1,X_2,\ldots,X_n\) er et tilfeldig utvalg fra \(n(x;\mu_1,\sigma_1)\)-populasjonen, at \(Y_1,Y_2,\ldots,Y_m\) er et tilfeldig utvalg fra \(n(y;\mu_2,\sigma_2)\)-populasjonen og at \(X_i\)-ene er uavhengige av \(Y_i\)-ene. Man kan da lage konfidensintervall for \(\mu_1-\mu_2\) og vi skal her se på de tre situasjonene

  • verdiene til \(\sigma_1^2\) og \(\sigma_2^2\) er begge kjente,
  • man vet at \(\sigma_1^2=\sigma_2^2,\) men verdien til denne felles varianse er ukjent, og
  • verdiene til \(\sigma_1^2\) og \(\sigma_2^2\) er begge ukjente.

Konfidensintervall for \(\mu_1-\mu_2\) når \(\sigma_1^2,\) \(\sigma_2^2\) kjente

For å lage konfidensintervall for \(\mu_1-\mu_2\) når verdiene til \(\sigma_1^2\) og \(\sigma_2^2\) begge er kjente er det vanlig å ta utgangspunkt i pivotalen \[Z = \frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}}} \sim n(z;0,1).\] Man skal merke seg at selv om \(X_1,X_2,\ldots,X_n\) og \(Y_1,Y_2,\ldots,Y_m\) ikke er normalfordelte, men er to uavhengige tilfeldige utvalg fra andre fordelinger, vil \(Z\) være tilnærmet standard normalfordelt når \(n\) og \(m\) er store. Dette følger fra sentralgrenseteoremet. Man kan dermed finne et tilnærmet konfidensintervall for \(\mu_1-\mu_2\) ved å ta utgangspunkt i \(Z\) også i denne situasjonen.

Konfidensintervall for \(\mu_1-\mu_2\) når \(\sigma_1^2=\sigma_2^2\) ukjent

For å lage konfidensintervall for \(\mu_1-\mu_2\) når man vet at \(\sigma_1^2=\sigma_2^2,\) men verdien til den felles variansen er ukjent, er det vanlig å ta utgangspunkt i pivotalen \[T=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{S_p^2 \left(\frac{1}{n}+\frac{1}{m}\right)}} \sim t_{n+m-2},\] der \[S_p^2=\frac{\left( \sum_{i=1}^n \left( X_i-\bar{X}\right)^2 + \sum_{i=1}^m \left(Y_i-\bar{Y}\right)^2\right)}{n+m-2}.\]

Konfidensintervall for \(\mu_1-\mu_2\) når \(\sigma_1^2,\) \(\sigma_2^2\) ukjente

For å lage konfidensintervall for \(\mu_1-\mu_2\) når verdiene til \(\sigma_1^2\) og \(\sigma_2^2,\) begge er ukjente er det vanlig å ta utgangspunkt i pivotalen \[T=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n}+\frac{s_2^2}{m}}} \approx t_{\nu},\] der \[v = \frac{\left( \frac{s_1^2}{n}+\frac{s_2^2}{m}\right)^2}{\frac{\left(\frac{s_1^2}{n}\right)^2}{n-1} + \frac{\left(\frac{s_2^2}{m}\right)^2}{m-1}}\] og \(s_1^2\) og \(s_2^2\) er empirisk varians for henholdsvis \(X_i\)-ene og \(Y_i\)-ene.

Man skal merke seg at \(T\) bare er tilnærmet T-fordelt med det gitte antall frihetsgrader. Ved å ta utgangspunkt i denne pivotalen får man dermed et tilnærmet konfidensintervall for \(\mu_1-\mu_2.\)

Binomisk fordeling, ett-utvalg

Anta \(X\sim b(x;n,p)\). Ved å ta utgangspunkt i \(\widehat{p}=\frac{X}{n}\) finnes det når \(n\) er stor to pivotaler man kan ta utgangspunkt i for å finne et konfidensintervall for \(p.\)

Normaltilnærming, løse andregradsulikhet

For å lage (tilnærmet) konfidensintervall for \(p\) kan man, dersom \(n\) er stor nok til at den binomiske fordelingen kan tilnærmes med en normalfordeling, ta utgangspunkt i \[Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \approx n(z;0,1).\]

Man skal merke seg at dersom man tar utgangspunkt i denne pivotalen må man løse andregradsulikheter for å komme frem til konfidensintervallet.

Normaltilnærming, ikke løse andregradsulikhet

For å lage (tilnærmet) konfidensintervall for \(p\) uten å måtte løse andregradsulikheter kan man ta utgangspunkt i \[Z = \frac{\widehat{p}-p}{\sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}} \approx n(z;0,1).\]

Merk at for å komme frem til at denne pivotalen er tilnærmet normalfordelt har man benyttet to approksimasjoner. Først har bruker man at \(\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}\) er tilnærmet normalfordelt, og deretter erstatter man \(p\)-ene som står i nevneren med approksimasjonen \(\widehat{p}\approx p.\)

Binomisk fordeling, to-utvalg

Anta at \(X\sim b(x;n,p_1)\) og \(Y\sim b(y;m,p_2)\) er uavhengige stokastiske variabler. Ved å ta utgangspunkt i \(\widehat{p}_1=\frac{X}{n}\) og \(\widehat{p}_2=\frac{Y}{m}\) kan man når \(n\) og \(m\) er store finne konfidensintervall for \(p_1-p_2\) ved å ta utgangspunkt i normaltilnærmingen for en binomisk fordelt variabel.

Normaltilnærming

For å lage (tilnærmet) konfidensintervall for \(p_1-p_2\) er det vanlig, når \(n\) og \(m\) er store nok, å ta utgangspunkt i pivotalen \[Z = \frac{\widehat{p}_1-\widehat{p}_2-(p_1-p_2)}{\sqrt{\frac{\widehat{p}_1(1-\widehat{p}_1)}{n} + \frac{\widehat{p}_2(1-\widehat{p}_2)}{m}}} \approx n(z;0,1).\]