Generalized Linear Model (GLM)

一般化線形モデル

回帰分析、分散分析、t 検定などを始めとする多くの解析手法や検定手法は、正規分布に従うデータにしか適用できない。そのため、正規分布に従わないデータを解析する際に、そのようなデータを何らかの近似関数で、正規分布に近似させて解析を行うアプローチが行われてきた。

\[ E[\mathbf{Y}] = \mathbf{X}\mathbf{\beta} \]

これを一般線形モデルという。これに対して、 Nelder と Wedderburn が一般化線形モデルを提唱し、データが正規分布に従わなくてもモデル化することができるようになり、応用範囲が広くなった。一般線形モデルのモデル式にたいして、一般化線形モデルは次のように、期待値をリンク関数 G とよばれる関数で変換したものを右辺と等しくなるようにしたモデルである。

\[ G(E[\mathbf{Y}]) = \mathbf{X}\mathbf{\beta} \]

データが指数型分布族の分布に従えば、その分布に対応するリンク関数は少なくとも 1 つ存在する。

一般化線形モデルを理解するには、線形代数、微分などの数学の知識を始めとして、最尤法、回帰分析などの一般線形モデルの理解が欠かせない。

References

  1. Nelder J, Wedderburn R. Generalized Linear Models. Journal of the Royal Statistical Society. Series A (General). 1972, 135(3):370-384. JSTOR
  2. P.M.E.Altham, Statistical Laboratory, University of Cambridge. Introduction to Generalized Linear Modelling. 2011. PDF
  3. Dobson AJ. An Introduction to Generalized Linear Models. Second Edition. 2002.
  4. 東京大学教養学部統計学教室編. 基礎統計学 III 自然科学の統計学. 1992.
  5. 久保 拓弥 確率と情報の科学 データ解析のための統計モデリング入門 ― 一般化線形モデル・階層ベイズモデル・MCMC. 2012.