統計の基本的な概念と仮説検定

基礎統計

統計は、観測されたデータに対して数学的な方法を用いて、データに隠された特性などを調べる際に利用される。また、観測されたデータからその背後にある母集団を推測する際にも使われる。

基礎統計・統計量

仮説検定あるいは統計モデリングを行うとき、実際の検定あるいはモデリングに取り掛かる前に、データ全体を一度ヒストグラムや散布図でプロットし、データの分布の特徴など調べるのが一般的である。分布の特徴を測る指標として、平均値、中央値、分散が一般的に知られている。これ以外にも、変動係数や四分位範囲のような重要な指標もいくつか挙げられる。

仮説検定

仮説検定とは、ある仮説が与えられたときに、その仮説は統計的に正しいかどうかを検証することである。一般的に使われているアプローチとして、集められたデータに対して帰無仮説を立て、統計的な手法でその帰無仮説が正しいかどうかを検証する。

多変量分析

t 検定や F 検定などは 2 つの群の間の統計量(平均値あるいは分散)を比較する方法である。そのため、実験群が増えると、t 検定や F 検定では取扱えなくなる。多群間の比較や多変量に対する解析は、それらに対応した手法で解析を進める必要がある。

多重比較検定・多重比較検定補正

検定を繰り返すと偽陽性が増える。そのため、検定を繰り返した場合、その検定結果に対して多重比較検定補正を行う必要がある。あるいは、はじめから多群間比較に対応した多重検定法を用いるべきである。

パラメーター推定

統計モデリングなどを行うときに、観測値をモデル式に代入して、モデル式中のパラメーターを推測する必要がある。シンプルなモデルであれば、最尤推定などが一般的に使われている。

その他