自己回帰モデル（AR） - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

自己回帰モデル (AR: Autoregressive model)

解説

自己回帰モデル（ARモデル）とは、時系列データにおいて「現在の値は、過去の自分自身の値（ラグ）によって決まる」と仮定して予測を行うモデルです。

ARモデルの概念図

「昨日のことは、今日に響く」

例えば、「昨日の気温が高ければ、今日も高くなりやすい」「昨日の株価が上がれば、今日もその影響を受ける」といった直感を数式にしたものです。
通常の回帰分析が「x（原因）で y（結果）を予測する」のに対し、ARモデルは「過去の y で現在の y を予測する」ため、自己（Auto）回帰（Regressive）と呼ばれます。

数式のイメージ

現在の値（y_t）は、過去の値（y_t-1, y_t-2……）に係数を掛けたものと、誤差（ノイズ）で表されます。

y_t = c + φ₁y_t-1 + φ₂y_t-2 + …… + ε_t

y_t：現在の値
y_t-1：1時点前の値（ラグ1）
φ（ファイ）：過去の値がどれくらい影響するかを表す係数
ε_t：予測できない誤差（ホワイトノイズ）

いくつの過去データを使うか（p時点前まで使うか）を「次数」と呼び、AR(p)と表記します。

重要な前提：定常性

ARモデルを適用するためには、データが「定常（Stationary）」である必要があります。これは、時間によって「平均」や「分散」が変化しない（トレンドや季節性がない）安定したデータであることを意味します。

G検定対策

出題ポイント

定義：「過去の自分の値」を説明変数として使う単変量の回帰モデル。
前提条件：データが「定常（平均や分散が一定）」である必要がある。
次数 p：AIC（赤池情報量基準）などを用いて、最適な過去の期間（次数）を決定する。

よくあるひっかけ問題

× ARモデルは、過去の「予測誤差」を使って現在の値を予測する
（解説）それは「MAモデル（移動平均モデル）」の説明です。
- ARモデル＝過去の「値」を使う。
- MAモデル＝過去の「誤差（ノイズ）」を使う。
この2つの区別は頻出です。
× ARモデルは、複数の変数を同時に予測する（例：気温と売上を同時に）
（解説）ARは基本的に「単変量（変数が1つ）」のモデルです。複数の変数を相互に予測する場合は「VARモデル（ベクトル自己回帰）」を使います。