変動要因

時系列データは、時刻が進むにつれ、値が刻々と変化していくデータである。時系列データの値の変化には、短期的な自己相関のほかに、傾向変動、周期変動や不規則変動などの複数の変動要因が含まれている。よって、時系列データは、次のように様々な変動要因に、ノイズが加わって観測される。

時系列データ = 短期の自己相関 + 傾向変動 + 周期変動 + 不規則変動 + ホワイトノイズ

短期的な自己相関

時系列データの変動要因には短期的な自己相関がある。例えば、ある日の平均気温がその前日の平均気温との相関が高いことなどが挙げられる。

傾向変動(トレンド)

長期的に観測することで見られるデータの変動傾向。例えば、数十年という長期間スケールで観測した二酸化炭素濃度データからは、二酸化炭素濃度が上昇している傾向が見られるなど。この場合、ある時点の観測値 yn とその 1 つ前の時点の観測値 yn-1 との間にある一定の差 k が見られることが一般的である。

\[ y_{n} = y_{n-1} + k \]

k > 0 ならば、その時系列データは右上りの傾向が見られるし、k < 0 ならば、その時系列データは右下がりの傾向が見られる。

周期変動

ある単位期間で繰り返し見られる変動傾向。例えば、細胞の時計遺伝子の発現量は、ほぼ 24 時間を 1 周期として、増減を繰り返している。また、太陽の黒点の数は、約 11 年の周期で増減を繰り返している。太陽の黒点の数の場合は、11 年周期で増減を繰り返しているので、ある年の黒点の数は、その 11 年前の黒点の数で書き表すことができる。

\[ y_{t} = y_{t - 11} \]

また、春夏秋冬あるいは乾雨季に応じて見られる季節変動も周期変動の 1 つとして数えることができる。例えば、1 年間の二酸化炭素の濃度は、夏では低く、冬では高くなる。

不規則変動(外因性変動)

自己相関、傾向変動、および循環変動で説明できない短期間でのデータの変化。外因性の現象(自然災害や突発事故など)によるデータの急変。このような変化が見られた後、データの傾向が元に戻る場合と戻らない場合がある。例えば前者の場合は、エルニーニョ現象が見られる年に漁獲量が激減するが、エルニーニョ現象が過ぎると漁獲量が元に戻ったりする。後者の場合は、例えば、河川の流量を調べたデータを分析して、ある年を境界にその流量が自己相関、傾向変動、および循環変動で説明つかないほど減ったりする場合がる。このような場合は、上流でダムが作られたりして、観測点の流量に大きな変化が現れ、しかも元に戻らなくなる 。

ホワイトノイズ

ホワイトノイズは、時系列データに含まれる残差成分で、時系列の変動に影響を与えず、また何の情報を含まない単なるノイズである。任意の時点 t のホワイトノイズの期待値と分散は、

\[ E[\epsilon_{t}] = 0 \] \[ Var[\epsilon_{t}] = \sigma ^{2} \]

である。また、ある時点 t と時点 t - k の自己相関が 0 である。つまり、両者の共分散が 0 である。

\[ Cov(\epsilon_{t}, \epsilon_{t-k}) = 0 \quad (k\ne 0) \]