Finne marginalfordelinger når simultanfordeling er spesifisert ved en tabell
Eksempel
Anta at vi har to diskrete stokastiske variabler \(X\) og \(Y\) og at deres simultanfordeling er angitt ved en tabell over \(f_{X,Y}(x,y)=P(X=x,Y=y)\) for alle mulige verdier av \(x\) og \(y.\) Hvordan kan vi ta regne ut marginalfordelingen for \(X\) og for \(Y?\) På temasiden hvor vi definerer simultanfordeling er også sammenhengen mellom simultanfordelingen og marginalfordelinger diskutert. På temasiden du ser på nå benytter vi denne sammenhengen i et eksempel.
Finne marginalfordelinger når simultanfordeling er spesifisert ved en tabell
Anta at \(X\) og \(Y\) er to diskrete stokastiske variabler med simultan punktsannsynlighet \(f_{X,Y}(x,y)=P(X=x,Y=y)\) er som angitt i følgende tabell:
\[ \begin{array}{c|cccc} x\text{\\} y & 0 & 1 & 2 & 3\\ \hline 0 & 0.05 & 0.10 & 0.01 & 0.03 \\ 1 & 0.00 & 0.05 & 0.08 & 0.20 \\ 2 & 0.11 & 0.04 & 0.09 & 0.04\\ 3 & 0.01 & 0.01 & 0.03 & 0.05 \\ 4 & 0.00 & 0.05 & 0.05 & 0.00 \end{array} \]
Finn da marginalfordelingene \(f_X(x)=P(X=x)\) og \(f_Y(y)=P(Y=y).\)
Utregning
Vi kan starte med å merke oss at vi fra tabellen over ser at de mulige verdiene for \(X\) er \(0,1,2,3\) og \(4,\) mens de mulige verdiene for \(Y\) er \(0,1,2\) og \(3.\) Ut fra den generelle sammenhengen mellom simultanfordeling og marginalfordeling for diskrete stokastiske variabler har vi da at marginal punktsannsynlighet for \(X\) er gitt ved \[f_X(x)=\sum_{y=0}^3 f_{X,Y}(x,y)\] for \(x=0,1,2,3,4.\) Dette betyr at vi får \(f_X(x)\) ved å summere tallene bortover hver rad i tabellen som angir \(f_{X,Y}(x,y).\) Vi får \begin{align}f_X(0) &= f_{X,Y}(0,0)+f_{X,Y}(0,1)+f_{X,Y}(0,2)+f_{X,Y}(0,3)\\ &= 0.05 + 0.10 + 0.01 + 0.03\\ &= 0.19,\\ f_X(1) &= f_{X,Y}(1,0)+f_{X,Y}(1,1)+f_{X,Y}(1,2)+f_{X,Y}(1,3)\\ &= 0.00 + 0.05 + 0.08 + 0.20\\ &= 0.33,\\ f_X(2) &= f_{X,Y}(2,0)+f_{X,Y}(2,1)+f_{X,Y}(2,2)+f_{X,Y}(2,3)\\ &= 0.11 + 0.04 + 0.09 + 0.04\\ &= 0.28,\\ f_X(3) &= f_{X,Y}(3,0)+f_{X,Y}(3,1)+f_{X,Y}(3,2)+f_{X,Y}(3,3)\\ &= 0.01 + 0.01 + 0.03 + 0.05\\ &= 0.10\\ \end{align} og \begin{align}f_X(4) &= f_{X,Y}(4,0)+f_{X,Y}(4,1)+f_{X,Y}(4,2)+f_{X,Y}(4,3)\\ &= 0.00 + 0.05 + 0.05 + 0.00\\ &= 0.10.\end{align} Marginalfordelingen for \(X\) er altså \[ \underline{\underline{f_X(x) = \left\{ \begin{array}{cc} 0.19 & \text{for \(x=0,\)}\\ 0.33 & \text{for \(x=1,\)}\\ 0.28 & \text{for \(x=2,\)}\\ 0.10 & \text{for \(x=3,\)}\\ 0.10 & \text{for \(x=4.\)}\end{array}\right.}}\] Alternativt kan vi uttrykke denne punktsannsynligheten i følgende tabell:
\[ \begin{array}{c|c|c|c|c|c} x & 0 & 1 & 2 & 3 & 4 \\ \hline f_X(x) & 0.19 & 0.33 & 0.28 & 0.10 & 0.10 \end{array} \]
Vi kan også visualisere fordelingen \(f_X(x)\) i et stolpediagram som vist i figur 1.
For å finne marginal punktsannsynlighet for \(Y\) tar vi igjen utgangspunkt i den generelle sammenhengen mellom simultanfordeling og marginalfordeling for diskrete stokastiske variabler. Her får vi \[f_Y(y)=\sum_{x=0}^4 f_{X,Y}(x,y)\] for \(y=0,1,2,3.\) Dette betyr at vi finner \(f_Y(y)\) ved å summere nedover hver kolonne i tabellen som angir simultan punktsannsynlighet \(f_{X,Y}(x,y).\) Vi får \begin{align}f_Y(0) &= f_{X,Y}(0,0) + f_{X,Y}(1,0) + f_{X,Y}(2,0) + f_{X,Y}(3,0) + f_{X,Y}(4,0)\\ &= 0.05 + 0.00 + 0.11 + 0.01 + 0.00 \\ &= 0.17,\\ f_Y(1) &= f_{X,Y}(0,1) + f_{X,Y}(1,1) + f_{X,Y}(2,1) + f_{X,Y}(3,1) + f_{X,Y}(4,1)\\ &= 0.10 + 0.05 + 0.04 + 0.01 + 0.05 \\ &= 0.25,\\ f_Y(2) &= f_{X,Y}(0,2) + f_{X,Y}(1,2) + f_{X,Y}(2,2) + f_{X,Y}(3,2) + f_{X,Y}(4,2)\\ &= 0.01 + 0.08 + 0.09 + 0.03 + 0.05 \\ &= 0.26\end{align} og \begin{align}f_Y(3) &= f_{X,Y}(0,3) + f_{X,Y}(1,3) + f_{X,Y}(2,3) + f_{X,Y}(3,3) + f_{X,Y}(4,3)\\ &= 0.03 + 0.20 + 0.04 + 0.05 + 0.00 \\ &= 0.32.\end{align} Marginalfordelingen for \(Y\) er altså \[\underline{\underline{f_Y(y) = \left\{\begin{array}{cc} 0.17 & \text{for \(y=0,\)}\\ 0.25 & \text{for \(y=1,\)}\\ 0.26 & \text{for \(y=2,\)}\\ 0.32 & \text{for \(y=3.\)}\end{array}\right.}}\] Også denne fordelingen kan alternativt uttrykkes i en tabell, \[\begin{array}{c|c|c|c|c} y & 0 & 1 & 2 & 3\\ \hline f_Y(y) & 0.17 & 0.25 & 0.26 & 0.32\end{array}\] og kan visualiseres i et stolpediagram som vist i figur 2.
Det er også mye vanlig å utvide tabellen som angir simultanfordelingen \(f_{XY}(x,y)\) slik at den også inneholder marginalfordelingene \(f_X(x)\) og \(f_Y(y).\) En slik utvidet tabell blir her seende slik ut:
\[ \begin{array}{c|cccc|c} x\text{\\} y & 0 & 1 & 2 & 3 & f_X(x) \\ \hline 0 & 0.05 & 0.10 & 0.01 & 0.03 & 0.19\\ 1 & 0.00 & 0.05 & 0.08 & 0.20 & 0.32 \\ 2 & 0.11 & 0.04 & 0.09 & 0.04 & 0.28\\ 3 & 0.01 & 0.01 & 0.03 & 0.05 & 0.10\\ 4 & 0.00 & 0.05 & 0.05 & 0.00 & 0.10\\ \hline f_Y(y) & 0.17 & 0.25 & 0.26 & 0.32 & 1.00 \end{array} \]