確率変数 X が一様分布に従うとき、その最大値と最小値の差はベータ分布に従う。n 個の確率変数 Xi (i = 1, 2, ..., n) が最小値 0 かつ最大値 1 の一様分布に従うとする。すなわち、
\[ X_{i} = U(0, 1) \]
最大値の分布
Xi の最大値を M とする。Xi が一様分布に従うことに注意すると、M の累積分布関数は以下のように求められる。
\[
\begin{eqnarray}
P(M \le x) &=& 1 - P(M \ge x) \\
&=& 1 - \prod_{i=1}^{n} P(X_{i} \ge x) \\
&=& 1- P(X \ge x)^{n} \\
&=& 1 - (1 - P(X \le x))^{n} \\
&=& 1 - (1 - x)^{n}
\end{eqnarray}
\]
よって、M の確率密度関数は以下のように求められる。
\[
\begin{eqnarray}
f_{M}(x) &=& \frac{d}{dx}P(M \le x) \\
&=& n(1-x)^{n-1}
\end{eqnarray}
\]
最小値の分布
Xi の最小値を m とする。Xi が一様分布に従うことに注意すると、m の累積分布関数は以下のように求められる。
\[
\begin{eqnarray}
P(m \le x) &=& \prod_{i=1}^{n} P(X_{i} \le x) \\
&=& P(X \le x)^{n} \\
&=& x^{n}
\end{eqnarray}
\]
よって、m の確率密度関数は以下のように求められる。
\[
\begin{eqnarray}
f_{m}(x) &=& \frac{d}{dx}P(m \le x) \\
&=& nx^{n-1}
\end{eqnarray}
\]
最大値と最小値の差が従う分布
最大値と最小値の差 D を従う分布は、M と m が独立でないので、fD(x) = fDM - fDm として求めることがでいない。
ここで、確率変数 Xi の範囲を d とし、d と最大値 y は以下の二通りに分けて考えることができる。
- x < 1 - d のとき、確率変数 Xi は [x, x+d] に含まれる。このとき、最大値 Y = x を除いた残りの n - 1 個の確率変数が [x, x+d] に一様分布する確率は d/(1-x) である。これをイベント E とする。
- x > 1 - d のとき、確率変数 Xi は [x, 1] = [1 - d, 1] に含まれる。このとき、すべての点が範囲 d に含まれる。
このとき、最大値と最小値の差 D の累積分布関数は以下のように二つの場合に分けて求められる。
\[
\begin{eqnarray}
P(D\le d) &=& \int_{0}^{1-d} f_{M}P(E)dx + P(M \ge 1 - d) \\
&=& \int_{0}^{1-d} n(1-x)^{n-1}\left( \frac{d}{1-x} \right)^{n-1}dx + d^{n} \\
&=& \int_{0}^{1-d} nd^{n-1}dx + d^{n} \\
&=& nd^{n-1}(1-d)+d^{n}
\end{eqnarray}
\]
また、確率密度関数は以下のように計算できる。
\[
\begin{eqnarray}
f_{D}(x) &=& \frac{d}{dx}P(D\le d) \\
&=& (1-x)x^{n-2}(n-1)n \\
&=& \frac{x^{n-2}(1-x)}{\frac{n - (n + 1)}{(n-1) n}} \\
&=& \frac{x^{n-2}(1-x)}{\int_{0}^{1}t^{n-2}(1-t)dt}\\
&\sim& \mathbf{Beta} (n-1, 2)
\end{eqnarray}
\]
従って、確率変数 X が一様分布に従うとき、その最大値と最小値の差がベータ分布に従うことが確認できる。
References
- Distribution of max, min and ranges for a sequence of uniform rv’s. Website