スコア検定

帰無仮説と対立仮説

仮説検定は帰無仮説を棄却するかどうか統計的に決定する方法である。一般化線形モデルにおいて、そのモデルの対数尤度関数の 1 次導関数はスコアとして定義されている。興味のあるモデルのパラメーターの最尤推定量が有意であれば、その最尤推定量を対数尤度関数の 1 次導関数に代入すれば 0 になると期待できる。つまり、帰無仮説が成り立つならばスコアは 0 になると期待できる。スコア検定はこのことを利用した検定である。

\(\hat{\mathbf{\beta}}\) をモデルの最尤推定量とすれば、帰無仮説と対立仮説は以下のように記述できる。

\[\begin{eqnarray} \mathcal{H}_{0} &:& E[U(\hat{\mathbf{\beta}})] = 0 \\ \mathcal{H}_{1} &:& E[U(\hat{\mathbf{\beta}})] \ne 0 \\ \end{eqnarray}\]

スコア統計量

スコアは対数尤度関数の 1 次導関数として定義されている。

\[ \mathbf{U}(\mathbf{\beta}) = \frac{\partial l}{\partial \beta} = \sum _{i=1}^{n} \frac{(y_{i} - \mu_{i})\mathbf{x}^{T}_{i \cdot}}{g'(\mu_{i})Var[y_{i}]} \]

以下、帰無仮説に対応するモデルおよび興味のあるモデルの最尤推定量をそれぞれ \(\hat{\mathbf{\beta}^{1}}\)、\(\hat{\mathbf{\beta}^{0}}\) とする。

スコアの期待値と分散共分散行列行列

スコアの期待値および分散共分散行列は以下のように求められる(計算過程)。

\[E[\mathbf{U}(\hat{\mathbf{\beta}})] = 0\]
\[Var[\mathbf{U}(\hat{\mathbf{\beta}})] = \mathbf{I}(\hat{\mathbf{\beta}})\]

統計量の分布

一般に、連続した値 t が存在するとき、t は正規分布に従うものと近似できる。また、t を標準化すれば、t は標準正規化に従う。すなわち、

\[ \frac{t-E[t]}{\sqrt{Var[t]}} \sim N(0, 1)\]

これは以下の式と同じである。

\[ \frac{(t-E[t])^{2}}{Var[t]} \sim \chi ^{2}(1)\]

t が要素数 p を持つベクトル t のとき、同じことを以下のように表現できる。ただし V を分散共分散行列とする。

\[ (\mathbf{t}-E[\mathbf{t}])^{T}\mathbf{V}(\mathbf{t})^{-1}(\mathbf{t}-E[\mathbf{t}]) \sim \chi ^{2}(p) \]

スコア統計量

ここで統計量 t を統計量 \(\mathbf{U}(\hat{\mathbf{\beta}})\) に置き換えて、また帰無仮説において \( E[\mathbf{U}(\hat{\mathbf{\beta}})] = 0 \) だから、以下の関係が得られる。

\[ \mathbf{U}(\hat{\mathbf{\beta}})^{T}\mathbf{\mathbf{I}}(\hat{\mathbf{\beta}})^{-1}\mathbf{U}(\hat{\mathbf{\beta}}) \sim \chi ^{2}(p) \]

スコア検定では左辺が自由度 p のカイの二乗分布に従うとして検定を行う。

References

  1. Chen H. Chapter 5. Hypothesis Testing. 2010. PDF
  2. Matthew S. Hypothesis Testing. 2013. PDF
  3. Lecture 16: Score and Wald Tests. PDF
  4. Dobson AJ. An Introduction to Generalized Linear Models. Second Edition. 2002.