Simultanfordeling
For å beskrive samvariasjonen til to eller flere stokastiske variabler angir vi deres simultane sannsynlighetsfordeling, også kalt simultanfordelingen. På denne temasiden definerer og diskuterer vi simultanfordelingen for to stokastiske variabler, men merk at vi har tilsvarende også for mer enn to stokastiske variabler.
Simultanfordeling
Vi starter med å definere hva vi skal mene med en simultanfordeling.
Notasjon
Man kan eventuelt angi hvilke stokastiske variabler en simultanfordeling gjelder for ved å angi dette som en indeks til \(f\)-en, tilsvarende som man kan når man har bare en stokastisk variabel. Simultanfordeling for \(X\) og \(Y\) kan man altså alternativt betegne med \(f_{XY}(x,y)\).
Egenskaper til en simultanfordeling
En simultanfordeling for en diskret stokastisk variabel \(X\) vil alltid ha følgende egenskaper:
- \(f(x,y) \geq 0\)
- \(\sum_x\sum_y f(x,y) = 1\)
- \(f(x,y) = P(X=x,Y=y)\)
En simultanfordeling for en kontinuerlig stokastisk variabel vil tilsvarende alltid ha følgende egenskaper:
- \(f(x,y) \geq 0\)
- \(\int_{-\infty}^\infty\int_{-\infty}^\infty f(x,y)\mbox{d}x\mbox{d}y = 1\)
- \(P((X,Y)\in A) = \iint\limits_A f(x,y)\mbox{d}x\mbox{d}y\) for \(A\subseteq \mathbb{R}^2\)
Marginalfordeling
Fra simultanfordelingen for to stokastiske variabler \(X\) og \(Y\) kan man finne fordelingen for \(X\) og \(Y\) hver for seg. Fordelingene for \(X\) og \(Y\) hver for seg kalles gjerne for marginalfordelinger, for å understreke at det er fordelinger hvor man ser på bare en stokastisk variabel. Hvis vi lar \(f_{XY}(x,y)\) være simultanfordelingen for \(X\) og \(Y\) og betegner marginalfordelingene for \(X\) og \(Y\) med henholdsvis \(f_X(x)\) og \(f_Y(y)\) har vi at \[f_X(x) = \sum_y f_{XY}(x,y)\] og \[f_Y(y) = \sum_x f_{XY}(x,y)\] hvis \(X\) og \(Y\) er diskrete stokastiske variabler, og \[f_X(x) = \int_{-\infty}^\infty f_{XY}(x,y)\mbox{d}y\] og \[f_Y(y) = \int_{-\infty}^\infty f_{XY}(x,y)\mbox{d}x\] hvis \(X\) og \(Y\) er kontinuerlige stokastiske variabler.