テューキーの検定は、各群のデータの母集団が正規分布に従い、かつ、各群の母分散が互いに等しいときに、それらの母平均が同じかどうかを検定する方法である。テューキーの検定を行うにあたって、例えば 4 つの検定対象群がある場合、次のように群ごとの平均と分散をまず用意しておく。
実験群 | データ | 個数 | 平均 | 分散 |
1 | x11, x12, .. ,x1n1 | n1 | μ1 | σ21 |
2 | x21, x22, .. ,x2n2 | n2 | μ2 | σ22 |
3 | x31, x32, .. ,x3n3 | n3 | μ3 | σ23 |
a | x41, x42, .. ,x4n4 | n4 | μ4 | σ24 |
テューキー検定
表中のデータをもとに、次のようにして誤差自由度 φE、誤差分散 VE を求める。(ただし、検定対照群の群の数が 4 ならば g = 4 とする。)
\[ \phi_{E} = N - g = \sum_{j=1}^{g}n_{j} - g \]
\[ V_{E} = \frac{\sum_{j=1}^{g}(n_{j} - 1)\sigma^{2}_{j}}{\phi_{E}} \]
誤差自由度と誤差分散を利用して i 群と j 群の t 統計量を求める。
\[ t_{ij} = \frac{|\mu_{i} - \mu_{j}|}{\sqrt{V_{E}\left( \frac{1}{n_{i}} + \frac{1}{n_{j}} \right)}} \]
すべての組み合わせについて t 統計量を求め、次の表のようにまとめる。
t 値表 | 1 | 2 | 3 | 4 |
1 | ||||
2 | t21 | |||
3 | t31 | t32 | ||
4 | t41 | t42 | t43 |
最後に、すべての t 統計値を境界値と比較する。境界値はステューデント化した分布(Q 分布)を利用して算出する。具体的には、有意水準を α とすると、tij が次式を満たすならば、i 群と j 群の母平均に有意な差がある、と判定を下す。
\[ t_{ij} \ge \frac{Q(g, \phi_{E}, \alpha)}{\sqrt{2}} \]
R を利用したテューキー検定
テューキー検定を行う関数は R の SimComp パッケージに実装されている。ここでは、乱数を使って 4 つの実験群 A、B、C および D を生成して、危険率 5% のもとで、テューキー検定を行う。ただし、A 群と B 群を同じ正規分布を生成する。
library(SimComp)
library(reshape2)
a <- rnorm(10, mean = 20, sd = 3)
b <- rnorm(10, mean = 20, sd = 3)
c <- rnorm(10, mean = 40, sd = 3)
d <- rnorm(10, mean = 15, sd = 3)
df <- rbind(
data.frame(group = 'A', weight = a),
data.frame(group = 'B', weight = b),
data.frame(group = 'C', weight = c),
data.frame(group = 'D', weight = d)
)
head(df)
## group weight
## 1 A 22.21557
## 2 A 18.45572
## 3 A 15.07946
## 4 A 22.74811
## 5 A 16.19755
## 6 A 22.21474
SimTestDiff(data = df, grp = "group", resp = "weight", type = "Tukey", covar.equal = T)
## Test for differences of means of multiple endpoints
## Assumption: Homogeneous covariance matrices for the groups
## Alternative hypotheses: True differences not equal to the margins
##
## comparison endpoint margin estimate statistic degr.fr p.value.raw p.value.adj
## B - A B - A weight 0 0.2445 0.1655 36 0.8695 0.9984
## C - A C - A weight 0 21.3643 14.4581 36 0.0000 0.0000
## D - A D - A weight 0 -4.4446 -3.0079 36 0.0048 0.0233
## C - B C - B weight 0 21.1198 14.2927 36 0.0000 0.0000
## D - B D - B weight 0 -4.6891 -3.1733 36 0.0031 0.0155
## D - C D - C weight 0 -25.8090 -17.4660 36 0.0000 0.0000
検定結果を見ると、A と B の p 値はあらかじめ設定した危険率 5% よりも大きく、A 群の平均値と B 群の平均値に有意差が認められなかったとわかる。また、A 群と B 群の比較以外のペアすべてにおいて、平均値に有意差が認められた。