検定の歴史 | Neyman-Pearson 流の仮説検定が提唱されるまでの歴史

生物実験で有意差を調べるための検定と言えば、t 検定や尤度比検定などが挙げられる。これらの検定方法は、一度に提唱されたわけではなく、短い統計の歴史の中で、複数の研究者らによって提唱され、定着してきた（宿久, 2013, Alex, 2017）。

統計検定に関する歴史の中で、初期の頃には、有意水準（危険率）や帰無仮説といった概念は存在しなかった。また、誤差に対する考え方も、様々であった。この頃に提案された検定には、Pearson のカイ 2 乗検定や Gosset の z 検定などがある。その少し後に、Fisher によって有意性検定（exact test）の概念が提唱され、母集団と標本の概念が明確された。有意水準や帰無仮説に関する概念もこの頃に導入された。

そして、やがて Neyman と Pearson によって、帰無仮説に加えて対立仮説、検定力などに関する近代的な統計概念が導入された。帰無仮説の検定に対して棄却あるいは採択の判断を下すとき、必ず 2 種類の誤りが生じる。一つは第一種過誤（Type I error, 偽陽性）とよばれるもので、帰無仮説が真であるにもかからわず棄却されてしまった誤りである。もう一つは、第二種過誤（Type II error, 偽陰性）とよばれるもので、帰無仮説が偽であるにもかからわず棄却されなかった誤りである。この 2 種類の誤りはトレードオフの関係にあり、一方を少なくすると、他方が多くなる。そこで、Neyman と Pearson は、第一種過誤の確率に対して上限を設けて、第二種過誤の確率を最小にするような検定を行う概念を提唱した。

現代において、Fisher 流に基づく検定と Neyman-Pearson 流に基づく検定が共存している。また、これらに加えて、主観確率に基づく Bayes 流の考え方もさかんに使われるようになった。

References

宿久洋. セミナー 1 統計的仮説検定を考える ― 統計的有意の背後にあるもの ―. コンピュータ＆エデュケーション 2013, 34(3):24-31. DOI: 10.14949/konpyutariyoukyouiku.34.24
Alex Reinhart (原著), 西原史暁 (翻訳). ダメな統計学: 悲惨なほど完全なる手引書. 勁草書房 2017.