カイ二乗分布に従う 2 つ変数の比が F 分布に従う

F 分布

自由度 m のカイ二乗分布に従う確率変数 X および自由度 n のカイ二乗分布に従う確率変数 Y があったとき、両者の比は自由度 n および m の F 分布に従う。

\[ \frac{\frac{U_{X}}{m}}{\frac{U_{Y}}{n}} \sim \mathcal{F}(m, n) \]

F 分布の確率密度関数は次のように表される。B はベータ関数を表す。

\[ f(x; m, n) = \frac{1}{B\left(\frac{m}{2}, \frac{n}{2}\right)} \left( \frac{mx}{mx+n} \right)^{\frac{m}{2}} \left( 1 - \frac{mx}{mx+n} \right)^{\frac{n}{2}}x^{-1} \]

F 分布は、2 つのカイ二乗分布に従う確率変数の比が従う分布であるので、2 つの変数の二乗和を比較する際に利用される。調査データが正規分布に従うとき、その分散は E[(X-E[X])2] のように、ある変数の二乗和になる。標準正規分布のとき、標本平均は 0 であることに注意すると、次のようになる。

\[ E[(X-E[X])^{2}] = \frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar{X} )^2 = \frac{1}{n-1}\sum_{i=1}^{n}x_{i}^2 \]

このように、分散が F 分布に深く関係してある。そのため、分散に関連する解析には F 分布が用いられる場合が多い。例えば、処理群と対称群の分散が同じであるかどうかの F 検定や、分散に着目した多群間比較である分散分析などで F 分布が使われる。

F 分布の確率密度関数の導出

カイ二乗分布に従う二つの確率変数 X および Y の比から F 分布の確率密度関数関数を導出できる。ここで、確率変数 X および Y は互いに独立で、X は自由度 m のカイ二乗分布に従い、Y は自由度 n のカイ二乗分布に従うものとする。確率変数 X および Y は互いに独立であるので、その同時確率密度関数は次のように分解できる。

\[ \begin{eqnarray} f(x, y; m, n) &=& f(x; m) f(y; n) \\ &=& \frac{1}{2^{\frac{m}{2}}\Gamma\left(\frac{m}{2}\right)}x^{\frac{m}{2}-1}\exp\left(-\frac{x}{2}\right) \frac{1}{2^{\frac{n}{2}}\Gamma\left(\frac{n}{2}\right)}y^{\frac{n}{2}-1}\exp\left(-\frac{y}{2}\right) \end{eqnarray} \]

次に、(x/m)/(y/n) の形に持っていくために、次のような変数変換を行う。

\[ z = \frac{\frac{x}{m}}{\frac{y}{n}} \] \[ w = y \]

この変数変換のヤコビアンを計算すると次のようになる。

\[ \frac{\partial (x, y)}{\partial (z, w)} = \begin{vmatrix} \frac{\partial x}{\partial z} & \frac{\partial x}{\partial w} \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \end{vmatrix} = \begin{vmatrix} \frac{m}{n}w & \frac{m}{n}z \\ 0 & 1 \end{vmatrix} = \frac{n}{m}w \]

変数変換を行なったあとの z と w の同時確率密度関数 g(z, w) を考えたとき、w につて周辺化し f(z) を求める。

\[ \begin{eqnarray} f(z) &=& \int_0^\infty g(z, w) dw \\ &=& \int_0^\infty f(x, w) \frac{\partial (x, y)}{\partial (z, w)} dw \\ &=& \int_0^\infty f(\frac{m}{n}zw, w)\frac{m}{n}w dzdw \\ &=& \int_0^\infty \frac{2^{-\frac{m+n}{2}}}{\Gamma\left(\frac{m}{2}\right)\Gamma\left(\frac{n}{2}\right)}\left(\frac{m}{n}zw\right)^{\frac{m}{2}-1}\exp\left(-\frac{m}{2n}zw\right) w^{\frac{n}{2}-1}\exp\left(-\frac{w}{2}\right)\frac{m}{n}w dw dz \\ &=& \frac{\left(\frac{m}{n}\right)^{\frac{m}{2}}z^{\frac{m}{2}-1}}{2^{\frac{m+n}{2}}\Gamma\left(\frac{m}{2}\right)\Gamma\left(\frac{n}{2}\right)} \int_0^\infty w^{\frac{m+n}{2}}\exp\left(-\frac{w(mz+n)}{2n}\right) dw \end{eqnarray} \]

ここで、 \( t = \frac{−w(mz+n)}{2n} \) とおくと、

\[ w = \frac{2nt}{mz+n} \] \[ dw = \frac{2n}{mz+n}dt \]

により、f(z) を求める式中の積分部分は次のように計算できる。

\[ \begin{eqnarray} \int_0^\infty w^{\frac{m+n}{2}}\exp\left(-\frac{w(mz+n)}{2n}\right) dw &=& \int_0^\infty \left(\frac{2nt}{mz+n}\right)^{\frac{m+n}{2}-1}\exp\left(-t\right) \frac{2n}{mz+n} dt \\ &=& \left(\frac{2n}{mz+n}\right)^{\frac{m+n}{2}} \int_0^\infty t^{\frac{m+n}{2}} \exp\left(-t\right)dt \\ &=& \left(\frac{2n}{mz+n}\right)^{\frac{m+n}{2}} \Gamma\left(\frac{m+n}{2}\right) \end{eqnarray} \]

したがって、f(z) は、

\[ \begin{eqnarray} f(z) &=& \frac{\left(\frac{m}{n}\right)^{\frac{m}{2}}z^{\frac{m}{2}-1}}{2^{\frac{m+n}{2}}\Gamma\left(\frac{m}{2}\right)\Gamma\left(\frac{n}{2}\right)} \left(\frac{2n}{mz+n}\right)^{\frac{m+n}{2}} \Gamma\left(\frac{m+n}{2}\right) \\ &=& \frac{1}{\frac{\Gamma\left(\frac{m}{2}\right)\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{m+n}{2}\right) }} \left( \frac{mz}{n} \right)^{\frac{m}{2}} \left( \frac{n}{mz +n } \right)^{\frac{m+n}{2}} z^{-1}\\ &=& \frac{1}{B(\frac{m}{2}, \frac{n}{2})} \left( \frac{mz}{mz + n} \right)^{\frac{m}{2}} \left( \frac{n}{mz +n } \right)^{\frac{n}{2}} z^{-1}\\ &=& \frac{1}{B\left(\frac{m}{2}, \frac{n}{2}\right)} \left( \frac{mz}{mz+n} \right)^{\frac{m}{2}} \left( 1 - \frac{mz}{mz+n} \right)^{\frac{n}{2}}z^{-1} \end{eqnarray} \]

以上により、自由度 m のカイ二乗分布に従う確率変数 X および自由度 n のカイ二乗分布に従う確率変数 Y の比 Z = (X/m)/(Y/n) は次の分布に従うことが導出された。

\[ f(z; m, n) = \frac{1}{B\left(\frac{m}{2}, \frac{n}{2}\right)} \left( \frac{mz}{mz+n} \right)^{\frac{m}{2}} \left( 1 - \frac{mz}{mz+n} \right)^{\frac{n}{2}}z^{-1} \]