Transformasjonsformel for kontinuerlig variabel

Regneregel

La \(X\) være en kontinuerlig stokastisk variabel med sannsynlighetstetthet \(f_X(x)\) og la \(Y=u(X),\) der \(u(x)\) er en gitt strengt monoton funksjon. I denne situasjonen er det relativt enkelt å bestemme sannsynlighetstettheten til \(Y,\) \(f_Y(y).\)

Transformasjonsformel for kontinuerlig variabel

Vi starter med å formulere teoremet som gir hva sannsynlighetstettheten \(f_Y(y)\) blir.

Beregning av \(f_Y(y)\)

En trinn for trinn beskrivelse av hvordan man kan regne ut \(f_Y(y)\) basert på teoremet over er gitt på en egen temaside.

Tolkning

I teoremet forutsettes det at sammenhengen mellom \(X\) og \(Y=u(X)\) er strengt monoton. I praksis betyr dette at \(u(x)\) enten er en strengt voksende eller strengt avtagende funksjon. Dersom \(u(x)\) er en strengt voksende funksjon må man ha at \begin{align}P(a < X < b) &= P(u(a) < u(X) < u(b))\\ &= P(u(a) < Y < u(b))\end{align} for enhver \(a<b\). Hvis vi uttrykker sannsynlighetene \(P(a<X<b)\) og \(P(u(a)<Y<u(b))\) som integraler over de respektive sannsynlighetstetthetene får vi dermed at vi må ha \[\int_a^b f_X(x)\text{d}x = \int_{u(a)}^{u(b)} f_Y(y)\text{d}y,\] og det er denne integralligningen som gir at \(f_Y(y)\) må være som gitt i teoremet. I figur 1 og 2 er dette illustrert for tilfellet \(X\sim n(x;0,1)\) og \(Y=u(X) = e^X\) når \(a=-0.5\) og \(b=1\). Arealet av det grønne området i intervallet \((-0.5,1)\) i figur 1 er altså her lik arealet av det grønne området i intervallet \((e^{-0.5},e^1)=(0.6065,2.7183)\) i figur 2.

Figur 1: Illustrasjonen av sannsynligheten \(P(-0.5<X<1)\) når \(X\sim n(x;0,1).\)
Figur 2: Illustrasjonen av sannsynligheten \(P(e^{-0.5}<Y<e^1)\) når \(Y=e^X\) og \(X\sim n(x;0,1).\)

Dersom \(u(x)\) er en strengt avtagende funksjon blir situasjonen litt annerledes. Da må man ha at \[P(a<X<b) = P(u(b) < u(X) < u(a)) = P(u(b) < Y < u(a))\] for enhver \(a<b\). Hvis vi nå uttrykker sannsynlighetene som integraler over de respektive sannsynlighetstetthetene får vi integralligningen \[\int_a^b f_X(x) \text{d}x = \int_{u(b)}^{u(a)} f_Y(y)\text{d}y\] som igjen gir at \(f_Y(y)\) må være som gitt i teoremet. Denne situasjonen er illustrert i figur 3 og 4 for tilfellet at \(X\) er uniformfordelt på \([0,1]\) og \(Y=u(X)=-\ln X/0.6\) når \(a=0.25\) og \(b=0.75\). Arealet av det grønne området i intervallet \((0.25,0.75)\) i figur 3 er altså her lik arealet av det grønne området i intervallet \((-\ln(0.75)/0.6,-\ln(0.25)/0.6)\)\(=(0.4795,2.3105)\) i figur 4.

Figur 3: Illustrasjonen av sannsynligheten \(P(0.25<X<0.75)\) når \(X\sim \text{Unif}(0,1).\)
Figur 4: Illustrasjonen av sannsynligheten \(P(-\ln(0.75)/0.6<Y<-\ln(0.25)/0.6)\) når \(Y=-\ln(X)/0.6\) og \(X\sim \text{Unif}(0,1).\)

Generaliseringer

Teoremet gitt her kan generaliseres i ulike retninger. Man kan formulere et teorem som sier hva som skjer hvis \(u(X)\) ikke er én-entydig, og man kan også angi hva som skjer når man har én-entydige transformasjoner av mer en én stokastisk variabel. Begge disse generaliseringene er diskutert i læreboka vi benytter.