Hypergeometrisk fordeling

Anta at man har en urne med røde og blå kuler. Hvis man da trekker ut et på forhånd spesifisert antall kuler, uten tilbakelegging, vil antall røde kuler trukket ut være hypergerometrisk fordelt. Det at man trekker kuler uten tilbakelegging gjør at trekningene blir avhengige, men ved å benytte telleregler fra kombinatorikk er man likevel i stand til å utlede punktsannsynligheten til en hypergeometrisk fordeling.

Hypergeometrisk fordeling

Vi starter med å definere en hypergeometrisk fordeling.

Notasjon

Det finnes ingen etablert notasjon for å spesifisere at en stokastisk variabel \(X\) er hypergeometrisk fordelt med parametre \(N,\) \(k\) og \(n.\) Noen bruker å skrive \(X\sim h(x;N,k,n),\) der \(h(x;N,k,n)\) er punktsannsynligheten til den angjeldende hypergeometriske fordeling.

Eksempler på punktsannsynlighet

Figur 1 til 3 viser stolpediagram av punktsannsynligheten \(f(x)\) i en hypergeometrisk fordeling med \(N=25,\) \(k=10\) og med \(n\) lik henholdsvis \(5, 10\) og \(15.\)

Figur 1: Punktsannsynlighet \(f(x)\) for en hypergeometrisk fordeling med \(N=25,\) \(n=5\) og \(k=10.\)
Figur 2: Punktsannsynlighet \(f(x)\) for en hypergeometrisk fordeling med \(N=25,\) \(n=10\) og \(k=10.\)
Figur 3: Punktsannsynlighet \(f(x)\) for en hypergeometrisk fordeling med \(N=25,\) \(n=15\) og \(k=10.\)

Kumulativ fordelingsfunksjon

Kumulativ fordelingsfunksjon kan finnes ved å benytte generell sammenheng mellom \(f(x)\) og \(F(x).\) For de mulige verdiene for \(x\) får vi her

\[ F(x) = \sum_{t=\max(0,n-N+k)}^x \frac{\binom{k}{t}\binom{N-k}{n-t}}{\binom{N}{n}} \]

Generelt kan denne summen dog ikke skrives på noen enkel analytisk form. Når man har behov for å evaluere kumulativ fordelingsfunksjon i en hypergeometrisk fordeling har man tre muligheter.

  • Man kan numerisk regne ut summen over. Dette er mest aktuelt dersom \(x\) er svært liten.
  • Man kan benytte et dataprogram der evaluering av \(F(x)\) er implementert.
  • Man kan benytte en statistisk tabell hvor \(F(x)\) er tabulert for en del verdier av \(N\), \(k\), \(n\) og \(x.\)

Sammenheng med andre fordelinger

Det finnes en sammenheng mellom hypergeometrisk fordeling og binomisk fordeling. Denne sammenhengen diskuteres på følgende temaside: