Web教科書

自己回帰モデル(AR)

自己回帰モデル (AR: Autoregressive model)

解説

自己回帰モデル(ARモデル)とは、時系列データにおいて「現在の値は、過去の自分自身の値(ラグ)によって決まる」と仮定して予測を行うモデルです。

ARモデルの概念図

「昨日のことは、今日に響く」

例えば、「昨日の気温が高ければ、今日も高くなりやすい」「昨日の株価が上がれば、今日もその影響を受ける」といった直感を数式にしたものです。
通常の回帰分析が「x(原因)で y(結果)を予測する」のに対し、ARモデルは「過去の y で 現在の y を予測する」ため、自己(Auto)回帰(Regressive)と呼ばれます。

数式のイメージ

現在の値(yt)は、過去の値(yt-1, yt-2……)に係数を掛けたものと、誤差(ノイズ)で表されます。

yt = c + φ1yt-1 + φ2yt-2 + …… + εt

  • yt:現在の値
  • yt-1:1時点前の値(ラグ1)
  • φ(ファイ):過去の値がどれくらい影響するかを表す係数
  • εt:予測できない誤差(ホワイトノイズ)

いくつの過去データを使うか(p時点前まで使うか)を「次数」と呼び、AR(p)と表記します。

重要な前提:定常性

ARモデルを適用するためには、データが「定常(Stationary)」である必要があります。これは、時間によって「平均」や「分散」が変化しない(トレンドや季節性がない)安定したデータであることを意味します。


G検定対策

出題ポイント

  • 定義:「過去の自分の値」を説明変数として使う単変量の回帰モデル。
  • 前提条件:データが「定常(平均や分散が一定)」である必要がある。
  • 次数 pAIC(赤池情報量基準)などを用いて、最適な過去の期間(次数)を決定する。

よくあるひっかけ問題

  • × ARモデルは、過去の「予測誤差」を使って現在の値を予測する
    (解説)それは「MAモデル(移動平均モデル)」の説明です。

    • ARモデル=過去の「値」を使う。
    • MAモデル=過去の「誤差(ノイズ)」を使う。

    この2つの区別は頻出です。

  • × ARモデルは、複数の変数を同時に予測する(例:気温と売上を同時に)
    (解説)ARは基本的に「単変量(変数が1つ)」のモデルです。複数の変数を相互に予測する場合はVARモデル(ベクトル自己回帰)」を使います。
タイトルとURLをコピーしました