複数の実験群の母平均に有意差があるかどうかを検定する多群間比較法

Tukey 検定

テューキーの検定は、各群のデータの母集団が正規分布に従い、かつ、各群の母分散が互いに等しいときに、それらの母平均が同じかどうかを検定する方法である。テューキーの検定を行うにあたって、例えば 4 つの検定対象群がある場合、次のように群ごとの平均と分散をまず用意しておく。

実験群データ個数平均分散
1x11, x12, .. ,x1n1n1μ1σ21
2x21, x22, .. ,x2n2n2μ2σ22
3x31, x32, .. ,x3n3n3μ3σ23
ax41, x42, .. ,x4n4n4μ4σ24

テューキー検定

表中のデータをもとに、次のようにして誤差自由度 φE、誤差分散 VE を求める。(ただし、検定対照群の群の数が 4 ならば g = 4 とする。)

\[ \phi_{E} = N - g = \sum_{j=1}^{g}n_{j} - g \] \[ V_{E} = \frac{\sum_{j=1}^{g}(n_{j} - 1)\sigma^{2}_{j}}{\phi_{E}} \]

誤差自由度と誤差分散を利用して i 群と j 群の t 統計量を求める。

\[ t_{ij} = \frac{|\mu_{i} - \mu_{j}|}{\sqrt{V_{E}\left( \frac{1}{n_{i}} + \frac{1}{n_{j}} \right)}} \]

すべての組み合わせについて t 統計量を求め、次の表のようにまとめる。

t 値表1234
1
2t21
3t31t32
4t41t42t43

最後に、すべての t 統計値を境界値と比較する。境界値はステューデント化した分布(Q 分布)を利用して算出する。具体的には、有意水準を α とすると、tij が次式を満たすならば、i 群と j 群の母平均に有意な差がある、と判定を下す。

\[ t_{ij} \ge \frac{Q(g, \phi_{E}, \alpha)}{\sqrt{2}} \]

R を利用したテューキー検定

テューキー検定を行う関数は R の SimComp パッケージに実装されている。ここでは、乱数を使って 4 つの実験群 A、B、C および D を生成して、危険率 5% のもとで、テューキー検定を行う。ただし、A 群と B 群を同じ正規分布を生成する。

library(SimComp)
library(reshape2)


a <- rnorm(10, mean = 20, sd = 3)
b <- rnorm(10, mean = 20, sd = 3)
c <- rnorm(10, mean = 40, sd = 3)
d <- rnorm(10, mean = 15, sd = 3)

df <- rbind(
    data.frame(group = 'A', weight = a),
    data.frame(group = 'B', weight = b),
    data.frame(group = 'C', weight = c),
    data.frame(group = 'D', weight = d)
)
head(df)
##   group   weight
## 1     A 22.21557
## 2     A 18.45572
## 3     A 15.07946
## 4     A 22.74811
## 5     A 16.19755
## 6     A 22.21474

SimTestDiff(data = df, grp = "group", resp = "weight", type = "Tukey", covar.equal = T)
## Test for differences of means of multiple endpoints
## Assumption: Homogeneous covariance matrices for the groups
## Alternative hypotheses: True differences not equal to the margins
## 
##       comparison endpoint margin estimate statistic degr.fr p.value.raw p.value.adj
## B - A      B - A   weight      0   0.2445    0.1655      36      0.8695      0.9984
## C - A      C - A   weight      0  21.3643   14.4581      36      0.0000      0.0000
## D - A      D - A   weight      0  -4.4446   -3.0079      36      0.0048      0.0233
## C - B      C - B   weight      0  21.1198   14.2927      36      0.0000      0.0000
## D - B      D - B   weight      0  -4.6891   -3.1733      36      0.0031      0.0155
## D - C      D - C   weight      0 -25.8090  -17.4660      36      0.0000      0.0000

検定結果を見ると、A と B の p 値はあらかじめ設定した危険率 5% よりも大きく、A 群の平均値と B 群の平均値に有意差が認められなかったとわかる。また、A 群と B 群の比較以外のペアすべてにおいて、平均値に有意差が認められた。