Generalized Linear Model (GLM)
一般化線形モデル
データが正規分布に従うとき、回帰分析は、従属変数 Y と独立変数 X を、パラメーター β でモデル化できる。そのモデル式は E[Y] = Xβ と書ける。しかし、データが正規分布に従わないときに、各独立変数 X に対応する従属変数 Y の分散が一定でなくなり、データを正規分布と仮定した一般線形モデルが利用できなくなる。
そこで、ある関数を使って、従属変数 Y の値を変換したあとに、モデル化することを考える。例えば、Y がポアソン分布に従う場合に、X が大きくなると、Y の分散も大きくなる。そこで、Y の値を対数変換すると、Y の値が大きくなっても、対数変換後の Y の値がそれほど大きくならず、Y の分散も小さくなる。このような状態で、対数変換した Y を X でモデル化することができるようになる。このような関数のことをリンク関数あるいは連結関数とよぶ。一般化線形モデルでは、リンク関数 G を用いて、 G(E[Y]) = Xβ のようにモデル化を行う。
References
- Generalized Linear Models. Journal of the Royal Statistical Society. Series A (General). 1972, 135(3):370-384. JSTOR
- Introduction to Generalized Linear Modelling. 2011. PDF
- An Introduction to Generalized Linear Models. Second Edition. 2002.
- 基礎統計学 III 自然科学の統計学. 1992.
- 確率と情報の科学 データ解析のための統計モデリング入門 ― 一般化線形モデル・階層ベイズモデル・MCMC. 2012.
- 一般線形モデル
- 一般化線形モデル(GLM)のパラメーター推定
- 検定とモデル選択
- 一般化線形モデルと検定
- AIC を利用したモデル選択
- 一般化線形モデルの応用例
- 二項反応モデル
- ポアソン回帰
- [R] カウントデータのポアソン回帰
- ポアソン回帰と過分散
- 対数線形モデル