Tukey 検定

テューキーの検定は、各群のデータの母集団が正規分布に従い、かつ、各群の母分散が互いに等しいときに、それらの母平均が同じかどうかを検定する方法である。テューキーの検定を行うにあたって、例えば 4 つの検定対象群がある場合、次のように群ごとの平均と分散をまず用意しておく。

実験群データ個数平均分散
1x11, x12, .. ,x1n1n1μ1σ21
2x21, x22, .. ,x2n2n2μ2σ22
3x31, x32, .. ,x3n3n3μ3σ23
ax41, x42, .. ,x4n4n4μ4σ24

テューキー検定

表中のデータをもとに、次のようにして誤差自由度 φE、誤差分散 VE を求める。(ただし、検定対照群の群の数が 4 ならば g = 4 とする。)

\[ \phi_{E} = N - g = \sum_{j=1}^{g}n_{j} - g \] \[ V_{E} = \frac{\sum_{j=1}^{g}(n_{j} - 1)\sigma^{2}_{j}}{\phi_{E}} \]

誤差自由度と誤差分散を利用して i 群と j 群の t 統計量を求める。

\[ t_{ij} = \frac{|\mu_{i} - \mu_{j}|}{\sqrt{V_{E}\left( \frac{1}{n_{i}} + \frac{1}{n_{j}} \right)}} \]

すべての組み合わせについて t 統計量を求め、次の表のようにまとめる。

t 値表1234
1
2t21
3t31t32
4t41t42t43

最後に、すべての t 統計値を境界値と比較する。境界値はステューデント化した分布(Q 分布)を利用して算出する。具体的には、有意水準を α とすると、tij が次式を満たすならば、i 群と j 群の母平均に有意な差がある、と判定を下す。

\[ t_{ij} \ge \frac{Q(g, \phi_{E}, \alpha)}{\sqrt{2}} \]

R を利用したテューキー検定

テューキー検定を行う関数は R の SimComp パッケージに実装されている。ここでは、乱数を使って 4 つの実験群 A、B、C および D を生成して、危険率 5% のもとで、テューキー検定を行う。ただし、A 群と B 群を同じ正規分布を生成する。

library(SimComp)
library(reshape2)


a <- rnorm(10, mean = 20, sd = 3)
b <- rnorm(10, mean = 20, sd = 3)
c <- rnorm(10, mean = 40, sd = 3)
d <- rnorm(10, mean = 15, sd = 3)

df <- rbind(
    data.frame(group = 'A', weight = a),
    data.frame(group = 'B', weight = b),
    data.frame(group = 'C', weight = c),
    data.frame(group = 'D', weight = d)
)
head(df)
##   group   weight
## 1     A 22.21557
## 2     A 18.45572
## 3     A 15.07946
## 4     A 22.74811
## 5     A 16.19755
## 6     A 22.21474

SimTestDiff(data = df, grp = "group", resp = "weight", type = "Tukey", covar.equal = T)
## Test for differences of means of multiple endpoints
## Assumption: Homogeneous covariance matrices for the groups
## Alternative hypotheses: True differences not equal to the margins
## 
##       comparison endpoint margin estimate statistic degr.fr p.value.raw p.value.adj
## B - A      B - A   weight      0   0.2445    0.1655      36      0.8695      0.9984
## C - A      C - A   weight      0  21.3643   14.4581      36      0.0000      0.0000
## D - A      D - A   weight      0  -4.4446   -3.0079      36      0.0048      0.0233
## C - B      C - B   weight      0  21.1198   14.2927      36      0.0000      0.0000
## D - B      D - B   weight      0  -4.6891   -3.1733      36      0.0031      0.0155
## D - C      D - C   weight      0 -25.8090  -17.4660      36      0.0000      0.0000

検定結果を見ると、A と B の p 値はあらかじめ設定した危険率 5% よりも大きく、A 群の平均値と B 群の平均値に有意差が認められなかったとわかる。また、A 群と B 群の比較以外のペアすべてにおいて、平均値に有意差が認められた。