前もって知ることのできない何らかの試行の結果を表す変数

確率変数

確率変数(random variable)は、前もって知ることのできない何らかの試行の結果を表す変数である。例えば、サイコロを振る試行において、その試行の結果は 1、2、3、4、5、6 のどれかとなる。試行前ではどの目が出るのかが不明であるため、それを変数 X とおく。そして、試行後に得られた結果で置き換える。例えば、試行後に 6 の目が出たならば、X = 6 とする。他の例として、ある植物の乾燥重量を考えるとき、その乾燥重量を変数 X とおくことができる。そして、実際に乾燥重量を測り、10.3g となれば、X = 10.3g とかけるようになる。このように、確率変数は、離散値と連続値の両方を取りうる。サイコロを振る試行やコインを投げる試行などの場合は、試行結果が離散値となる。一方、身長や体重を測る試行等の場合は、試行結果が連続値となる。

確率変数 X がある値をとる確率を関数の形で書き表したものを確率質量関数あるいは確率密度関数である。例えば、公平なサイコロを振ったとき、1、2、3、4、5、6 の目が出る確率はすべて 1/6 である。すなわち、

\[ P(X=1) = P(X=2) = \cdots = P(X=6) = \frac{1}{6} \]

このとき、P(X) を確率質量関数という。これに対して、X が連続値である場合、各値をとる確率を関数の形で書き表したものを確率密度関数という。

確率質量関数 (probability mass function)

数列 {pn} があり、\( \forall k\ge 0, \forall p_{k}\ge 0 \)で、かつ \( \sum_{k=0}^{\infty}p_{k}=1 \)のとき、

\[ p_{k} = P(X=k) \] \[ k=0,1,2,... \]

ならば、pk (k = 0, 1, 2, ...) を X の確率質量関数という。単に確率関数(probability function)ともいう。たとえば、関数 pk は X が k の値をとるときの確率を表す。

また、確率変数の X が k 以下の値をとるときの確率の和を表す関数のことを累積分布関数(cumulative distribution function)という。単に分布関数(distribution function)ともいう。

\[ F(k)=P(X\le k)=\sum_{i\le k}p(i) \]

確率密度関数 (probability density function)

確率変数が\( (-\infty,\infty) \)において連続かつ \( \int_{- \infty}^{\infty}f(x)dx=1 \) となる非負数関数が存在し、任意の区間 (a, b) において、

\[ P(a \lt X \lt b)= \int_{a}^{b}f(x)dx \]

ならば、f(x) を X の確率密度関数という。

また、

\[ F(x)=P(X\le x)=\int_{-\infty}^{x}f(t)dt \]

となる F(x) を X の累積分布関数という。