Generalized Linear Model (GLM)

一般化線形モデル

データが正規分布に従うとき、回帰分析は、従属変数 Y と独立変数 X を、パラメーター β でモデル化できる。そのモデル式は E[Y] = Xβ と書ける。しかし、データが正規分布に従わないときに、各独立変数 X に対応する従属変数 Y の分散が一定でなくなり、データを正規分布と仮定した一般線形モデルが利用できなくなる。

そこで、ある関数を使って、従属変数 Y の値を変換したあとに、モデル化することを考える。例えば、Y がポアソン分布に従う場合に、X が大きくなると、Y の分散も大きくなる。そこで、Y の値を対数変換すると、Y の値が大きくなっても、対数変換後の Y の値がそれほど大きくならず、Y の分散も小さくなる。このような状態で、対数変換した Y を X でモデル化することができるようになる。このような関数のことをリンク関数あるいは連結関数とよぶ。一般化線形モデルでは、リンク関数 G を用いて、 G(E[Y]) = Xβ のようにモデル化を行う。

References

  1. Nelder J, Wedderburn R. Generalized Linear Models. Journal of the Royal Statistical Society. Series A (General). 1972, 135(3):370-384. JSTOR
  2. P.M.E.Altham, Statistical Laboratory, University of Cambridge. Introduction to Generalized Linear Modelling. 2011. PDF
  3. Dobson AJ. An Introduction to Generalized Linear Models. Second Edition. 2002.
  4. 東京大学教養学部統計学教室編. 基礎統計学 III 自然科学の統計学. 1992.
  5. 久保 拓弥 確率と情報の科学 データ解析のための統計モデリング入門 ― 一般化線形モデル・階層ベイズモデル・MCMC. 2012.