Generalized Linear Model (GLM)

一般化線形モデル

データが正規分布に従うとき、回帰分析は、従属変数 Y と独立変数 X を、パラメーター β でモデル化できる。そのモデル式は E[Y] = Xβ と書ける。しかし、データが正規分布に従わないときに、各独立変数 X に対応する従属変数 Y の分散が一定でなくなり、データを正規分布と仮定した一般線形モデルが利用できなくなる。

データが正規分布に従わないとき、ある関数を使って、従属変数 Y の値を変換したあとに、モデル化を行うことでうまくいく場合がある。例えば、Y がポアソン分布の場合、X が大きくなると、Y の分散も大きくなる。そこで Y の値を対数変換すると、Y の分散が小さくなり、モデル化が可能になる。このような関数のことをリンク関数あるいは連結関数とよぶ。一般化線形モデルでは、リンク関数 G を用いて、 G(E[Y]) = Xβ のようにモデル化を行う。

References

  1. Nelder J, Wedderburn R. Generalized Linear Models. Journal of the Royal Statistical Society. Series A (General). 1972, 135(3):370-384. JSTOR
  2. P.M.E.Altham, Statistical Laboratory, University of Cambridge. Introduction to Generalized Linear Modelling. 2011. PDF
  3. Dobson AJ. An Introduction to Generalized Linear Models. Second Edition. 2002.
  4. 東京大学教養学部統計学教室編. 基礎統計学 III 自然科学の統計学. 1992.
  5. 久保 拓弥 確率と情報の科学 データ解析のための統計モデリング入門 ― 一般化線形モデル・階層ベイズモデル・MCMC. 2012.