F 検定は 2 つの実験群のデータの母分散が等しいかどうかを検定する方法である。2 つの実験群の母集団が正規分布に従う必要がある。2 つの実験群が互いに独立しているとき、実験群 1 の母集団の個体数を n1、分散を \( \sigma^{2}_{1} \) とし、実験群 2 の母集団の個体数を n2、分散を \( \sigma^{2}_{2} \) とすると、両者の比は自由度 n1、n2 の F 分布に従う。
\[ \frac{\sigma^{2}_{1}}{\sigma^{2}_{2}} \sim F(n_{1},n_{2})\]帰無仮説(\( \sigma^{2}_{1} = \sigma^{2}_{2} \))が成立すれば、両者の比は F 分布の中心近くに分布する。しかし、\( \sigma^{2}_{1}\) が \(\sigma^{2}_{2}\) よりも大きいとき、または\( \sigma^{2}_{1}\) が \(\sigma^{2}_{2}\) よりも小さいときに、両者の比は極端に F 分布の右端または左端に分布する(上図の塗りのない領域)。つまり、両者の比が、F 分布の右端あるいは左端に含まれているかどうかを調べることで、2 つの母分散に差があるかどうかを明らかにすることができる。これを F 検定という。
ほとんどの場合、母分散は未知である。このとき、母分散の代わりに標本の不偏分散を用いて F 検定を行う。標本の不偏分散を用いたときに、自由度は 1 つ減る。そのため、実験群 1 と実験群 2 の不偏分散の比は自由度 n1 - 1、n2 - 1 の F 分布に従う。この分布をものとに、F 検定を行う。
\[ \frac{\hat{s}^{2}_{1}}{\hat{s}^{2}_{2}} \sim F(n_{1}-1,n_{2}-1)\]R による F 検定
R では var.test
を利用して F 検定を行う。
x <- c(10, 23, 19, 14, 41, 33, 36, 31, 50)
y <- c(14, 84, 44, 11, 36, 71, 34, 54, 61)
var.test(x, y)
##
## F test to compare two variances
##
## data: x and y
## F = 0.28322, num df = 8, denom df = 8, p-value = 0.09328
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.06388415 1.25556580
## sample estimates:
## ratio of variances
## 0.283215
「alternative hypothesis: true ratio of variances is not equal to 1」、つまり、対立仮説は「両サンプルの不偏分散の比が 1 でない( = 両者の分散が異なる)」である。帰無仮説は両サンプルの不偏分散の比が 1 である。この帰無仮説に対して、F 統計量 = 0.28322 は 帰無仮説の 95% 信頼区間(0.06~1.26)に含まれているため、帰無仮説を棄却することはできない。すなわち、危険率 5% のとき、x と y の分散に有意差が存在しない。