Ekstremvariabler

Anta at vi har uavhengige stokastiske variabler \(X_1,X_2,\ldots,X_n\) og at vi er interessert i sannsynlighetsfordelingen til den minste av disse, eventuelt at vi er interessert i sannsynlighetsfordeling til den største. Det viser seg at så lenge de stokastiske variablene er uavhengige av hverandre kan man relativt enkelt finne disse sannsynlighetsfordelingene. Verdien til den minste av \(X_i\)-ene er det vanlig å betegne som \(X_{(1)},\) mens den tilsvarende største betegnes som \(X_{(n)}.\) De stokastiske variablene \(X_{(1)}\) og \(X_{(n)}\) kalles ekstremvariabler.

Ekstremvariabler

Vi starter med en formell definisjon av ekstremvariablene.

Notasjon

Det er vanlig å la \(X_{(k)}\) betegne den \(k\)-te minste av \(X_1,X_2,\ldots,X_n\). Med denne notasjonen blir \(X_{(1)}\) den minste av \(X_1,X_2,\ldots,X_n\) slik som angitt i teoremet over. \(X_{(n)}\) er den \(n\)-te minste, dvs. den største av \(X_1,X_2,\ldots,X_n\).

Kommentar

Man kan merke seg at ekstremvariablene \(X_{(1)}\) og \(X_{(n)}\) er funksjoner av de stokastiske variablene \(X_1,X_2,\ldots,X_n\) selv om det ikke er vanlig å benytte den vanlige funksjonsnotasjonen \(u(X_1,X_2,\ldots,X_n)\) i forbindelse med ekstremvariablene.

Illustrasjon

Anta at man har et system bestående av \(n\) komponenter, og at \(X_1,X_2,\ldots,X_n\) er levetiden til hver av disse \(n\) komponentene. Anta videre at systemet kun fungerer så lenge samtlige \(n\) komponenter fungerer. Da blir \(X_{(1)}=\min\{ X_1,X_2,\ldots,X_n\}\) levetiden til systemet. Denne situasjonen kan illustreres ved en seriekobling, som vist i figur 1.

Figur 1: Illustrasjon av \(X_{(1)}\) som et seriekoblet system.

Anta igjen at vi har et system bestående av \(n\) komponenter, og at \(X_1,X_2,\ldots,X_n\) er levetiden til hver av disse \(n\) komponentene. Anta nå at systemet fungerer så lenge minst en av de \(n\) komponentene fungerer. Da blir blir levetiden til systemet \(X_{(n)}=\max\{ X_1,X_2,\ldots,X_n\}\). Denne situasjonen kan illustreres ved en parallellkobling, som vist i figur 2.

Figur 2: Illustrasjon av \(X_{(n)}\) som et parallellkoblet system.

Sannsynlighetfordeling for ekstremvariabler

Nå diskuterer vi det sentrale punktet i utledning av sannsynlighetsfordelingene til ekstremvariablene. Vi starter med å diskutere fordelingen til \(X_{(n)}\) siden det er et lite hakk enklere å finne denne enn å finne fordelingen til \(X_{(1)}.\)

Kumulativ fordeling for \(X_{(n)},\) \(F_{X_{(n)}}(x)\)

Det sentrale punktet for å komme frem til en formel for \(F_{X_{(n)}}(x)\) er å innse at \(X_{(n)}=\max\{X_1,X_2,\ldots,X_n\}\) er mindre enn eller lik et tall \(x\) hvis og bare hvis alle \(X_1,X_2,\ldots,X_n\) er mindre enn eller lik \(x\). Ved i tillegg å benytte at \(X_i\)'ene er uavhengige får man \begin{align} &F_{X_{(n)}}(x) = P(X_{(n)}\leq x)\\ &= P(\max\{ X_1,X_2,\ldots,X_n\} \leq x)\\ &= P(X_1\leq x, X_2\leq x,\ldots,X_n\leq x)\\ &= P(X_1\leq x) \cdot P(X_2\leq x)\cdot \ldots\cdot P(X_n\leq x) \\ &= F_{X_1}(x) \cdot F_{X_2}(x)\cdot \ldots\cdot F_{X_n}(x).\end{align}

Dersom man antar at alle \(X_1,X_2,\ldots,X_n\) har samme sannsynlighetsfordeling kan man forenkle dette uttrykket. Dette er diskutert i mer detalj på temasiden «Fordeling av ekstremvariabler av uavhengige og identisk fordelte variabler». Dessuten, dersom \(X_i\)'ene er kontinuerlige stokastiske variabler blir også \(X_{(n)}\) en kontinuerlig stokastisk variabel, og man kan finne uttrykk for sannsynlighetstettheten til \(X_{(n)}\) ved å derivere \(F_{X_{(n)}}(x).\)

Kumulativ fordeling for \(X_{(1)},\) \(F_{X_{(1)}}(x)\)

Det sentrale punktet for å komme frem til en formel for \(F_{X_{(1)}}(x)\) er å innse at \(X_{(1)}=\min\{X_1,X_2,\ldots,X_n\}\) er ekte større enn et tall \(x\) hvis og bare hvis alle \(X_1,X_2,\ldots,X_n\) er ekte større enn \(x\). Ved i tillegg å benytte at \(X_i\)'ene er uavhengige får man \begin{align}&F_{X_{(1)}}(x) = P(X_{(1)}\leq x) = 1- P(X_{(1)} > x)\\ &= 1 - P(\min\{ X_1,X_2,\ldots,X_n\} > x)\\&= 1 - P(X_1 > x, X_2 > x,\ldots,X_n > x)\\ &= 1 - P(X_1 > x) \cdot P(X_2 > x)\cdot \ldots\cdot P(X_n > x) \\ &= 1 - (1-P(X_1\leq x))\cdot (1-P(X_2\leq x))\\ &~~~~~~\cdot\ldots\cdot (1-P(X_n\leq x))\\ &= 1- (1-F_{X_1}(x)) \cdot (1-F_{X_2}(x))\\ &~~~~~~\cdot \ldots\cdot (1-F_{X_n}(x)).\end{align}

Dersom man antar at alle \(X_1,X_2,\ldots,X_n\) har samme sannsynlighetsfordeling kan man forenkle dette uttrykket. Dette er diskutert i mer detalj på temasiden «Fordeling av ekstremvariabler av uavhengige og identisk fordelte variabler». Dessuten, dersom \(X_i\)'ene er kontinuerlige stokastiske variabler blir også \(X_{(n)}\) en kontinuerlig stokastisk variabel, og man kan finne uttrykk for sannsynlighetstettheten til \(X_{(n)}\) ved å derivere \(F_{X_{(n)}}(x).\)