Web教科書

赤池情報量規準 (AIC)

赤池情報量規準 (AIC: Akaike Information Criterion)

解説

赤池情報量規準(AIC)は、1973年に赤池弘次氏によって提案された、モデルの良さを評価するための統計的指標です。「モデルはシンプルで、かつデータによく当てはまるものが良い」という考え方(オッカムの剃刀)を数式化したものです。

「当てはまり」と「シンプルさ」のバランス

モデルを作る際、パラメータ(変数)を増やせば増やすほど、手元のデータへの当てはまり(尤度)は良くなります。しかし、複雑すぎるモデルは「過学習」を起こし、未知のデータには通用しなくなります。
AICは、このジレンマを解決するために設計されました。

AIC = -2 ln(L) + 2k

  • -2 ln(L):当てはまりの悪さ(尤度Lが大きいほどこの値は小さくなる=良い)。
  • + 2k:パラメータ数(k)に応じたペナルティ

つまり、「当てはまりの良さ」と「モデルのシンプルさ(パラメータの少なさ)」のバランスを取り、このAICの値が「小さいほど良いモデル」と判断します。


G検定対策

出題ポイント

  • 目的:モデルの「予測精度(尤度)」と「複雑さ(パラメータ数)」のバランスを評価し、過学習を防ぐ。
  • 判定:AICの値が「小さい(最小になる)」モデルを選択する。
  • 構造:「当てはまりの良さ」-「複雑さへのペナルティ」という構造を持つ。

よくあるひっかけ・BICとの違い

AICとよく似た指標にBIC(ベイズ情報量規準)があります。この違いは超頻出です。

指標 ペナルティ項 特徴
AIC 2k 予測性能を重視する。
BIC k ln(n)
(データ数nが影響)
AICよりペナルティが厳しい(大きく出る)。
よりシンプルなモデルを選びやすい。
タイトルとURLをコピーしました