統計の基本的な概念と仮説検定
基礎統計
統計は、観測されたデータに対して数学的な方法を用いて、データに隠された特性などを調べる際に利用される。また、観測されたデータからその背後にある母集団を推測する際にも使われる。
基礎統計
仮説検定あるいは統計モデリングを行うとき、実際の検定あるいはモデリングに取り掛かる前に、データ全体を一度ヒストグラムや散布図でプロットし、データの分布の特徴など調べるのが一般的である。分布の特徴を測る指標として、平均値、中央値、分散が一般的に知られている。これ以外にも、変動係数や四分位範囲のような重要な指標もいくつか挙げられる。
仮説検定
仮説検定とは、ある仮説が与えられたときに、その仮説は統計的に正しいかどうかを検証することである。一般的に使われているアプローチとして、集められたデータに対して帰無仮説を立て、統計的な手法でその帰無仮説が正しいかどうかを検証する。
多変量解析
t 検定や F 検定などは 2 つの群の間の統計量(平均値あるいは分散)を比較する方法である。そのため、実験群が増えると、t 検定や F 検定では取扱えなくなる。多群間の比較や多変量に対する解析は、それらに対応した手法で解析を進める必要がある。
多重比較
検定を繰り返すと偽陽性が増える。そのため、検定を繰り返した場合、その検定結果に対して多重比較検定補正を行う必要がある。あるいは、はじめから多群間比較に対応した多重検定法を用いるべきである。
パラメーター推定
統計モデリングなどを行うときに、観測値をモデル式に代入して、モデル式中のパラメーターを推測する必要がある。シンプルなモデルであれば、最尤推定などが一般的に使われている。