ある集合を、いくつかの属性に従い分類し、その分類結果をまとめた表を分割表という。対数線形モデルは分割表にまとめられたデータを解析する際に利用される解析法の一つである。分割表にまとめられた観測値を対数化したものを従属変数として、分割表の各カテゴリ(要因)を独立変数としてモデルを作成する。
二次元分割表
もっとも簡単な分割表として、2×2 の分割表が考えられる。例えば、100 人に右利きか左利きかとアンケートを取り、その結果を男女別に以下のようにまとめることができる。
男性 | 女性 | 合計 | |
左利き | 41 | 42 | 83 |
右利き | 7 | 10 | 17 |
合計 | 48 | 52 | 100 |
上の例では「左利きか右利きか」と「男性か女性か」の 2 つの属性を想定し、それぞれの属性にはとり得る状態が 2 つだけである。しかし、これは必ずしも 2 つだけでなくてもよい。
例えば、マイクロアレイデータを遺伝子発現プロファイルに応じて 4 つのクラスタに分けたとする。それぞれのクラスタにアノテーションされている GO term を調べ、これらを表にまとめたものも二次元分割表である。
Class 1 | Class 2 | Class 3 | Class 4 | 合計 | |
GO:010001 | 20 | 32 | 7 | 47 | 106 |
GO:023401 | 12 | 18 | 3 | 31 | 64 |
... | ... | ... | ... | ... | ... |
GO:300213 | 32 | 12 | 13 | 58 | 115 |
合計 | N |