線形モデルにリンク関数を導入し、一般化した線形モデル

一般化線形モデル

データが正規分布に従うとき、回帰分析は、従属変数 Y と独立変数 X を、パラメーター β でモデル化できる。そのモデル式は E[Y] = Xβ と書ける。

一般線形モデルは Y=Xb で表すことができ、両者には線形関係が見られる。

しかし、データが正規分布に従わないときに、例えば、データがポアソン分布に従うときに、回帰分析を行うと次のようになる。このように求められた回帰直線は、独立変数 X と従属変数 Y の関係を正しく説明できていないように見える。

ポアソン分布に従うデータを一般線形モデルでモデル化した結果。

そこで、データが正規分布に従わないとき、例えば、従属変数 Y を対数化した値で、回帰分析してみると、次のような結果が得られる。従属変数を対数化することにより、回帰分析がより正しくなった。

ポアソン分布に従うデータを対数化してから一般線形モデルでモデル化した結果。

一般化線形モデルは、このように従属変数 Y に対して、ある関数(例えば対数関数)を使って、値を変更した後に、モデル化を行う方法である。その「ある関数」は、一般化線形モデルの用語ではリンク関数あるいは連結関数と呼ばれている。一般線形モデルは Y = Xβ の式を利用してモデル化するに対して、一般化線形モデルは、リンク関数 G を用いて、次のようにモデル化を行う。

\[ G(E[\mathbf{Y}]) = \mathbf{ X}\mathbf{ \beta} \]

一般化線形モデルでは、上式の右辺を線形予測子 ηと読んでいる。一般に、η = Xβ と略して書いたりする。また、E[Y] も単に μ と書いたりする。このとき、上の式は、次のようにかけて、一般化線形モデルでよく見かける G(μ)=η のモデル式となる。

\[ G(\mu) = \eta \]

References

  1. Müller M. Generalized Linear Models. 2004. PDF
  2. 一般線形モデル Wikipedia
  3. 山村. 一般線形モデル. 2013. PDF