対数線形モデル

分割表

ある集合を、いくつかの属性に従い分類し、その分類結果をまとめた表を分割表という。対数線形モデルは分割表にまとめられたデータを解析する際に利用される解析法の一つである。分割表にまとめられた観測値を対数化したものを従属変数として、分割表の各カテゴリ(要因)を独立変数としてモデルを作成する。

二次元分割表

もっとも簡単な分割表として、2×2 の分割表が考えられる。例えば、100 人に右利きか左利きかとアンケートを取り、その結果を男女別に以下のようにまとめることができる。

男性女性合計
左利き414283
右利き71017
合計4852100

上の例では「左利きか右利きか」と「男性か女性か」の 2 つの属性を想定し、それぞれの属性にはとり得る状態が 2 つだけである。しかし、これは必ずしも 2 つだけでなくてもよい。

例えば、マイクロアレイデータを遺伝子発現プロファイルに応じて 4 つのクラスタに分けたとする。それぞれのクラスタにアノテーションされている GO term を調べ、これらを表にまとめたものも二次元分割表である。

Class 1Class 2Class 3Class 4合計
GO:0100012032747106
GO:023401121833164
..................
GO:30021332121358115
合計N