最小分散不偏推定 | ドイツ戦車問題（German Tank Problem）と最大値推定

最大値の推定に最小分散不偏推定という方法がある。この方法は、第二次世界大戦の時に、ドイツの戦車の生産数を予測するのに使われていた。そのため、この方法を利用した最大値推定は、ドイツ戦車問題（German tank probelm）とも呼ばれている。具体的に、1 から N までの整数があり、この中からいくつかの整数をサンプリングすることで、そのサンプリングした標本を利用して、最大値 N を推測するという方法である。数式で表すと、次のようになる。

\[ \hat{N} = m - \frac{m}{k} - 1 \]

m はサンプリングされた標本の中の最大値で、k は標本数を表す。

例えば、N = 1000 のとき、1 から 1000 の中からランダムに k = 20 個の標本を取り出して、最小分散不偏推定で最大値を推定すると次のようになる。

N <- 1000
k <- 20
x <- sample(1:N, k)
max(x) - max(x) / k - 1
## [1] 904.35