汎化誤差 - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

汎化誤差 (Generalization Error)

汎化誤差（テスト誤差）とは、学習済みモデルが「まだ見たことのない未知のデータ」に対して、どれくらい正確に予測できるかを示す指標です。

訓練誤差との違いは、受験勉強に例えると明確になります。

AI開発の最終ゴールは、過去問を暗記することではなく、実社会の未知のデータ（本番）を正しく予測することです。したがって、最も重視すべき指標はこの「汎化誤差」になります。

訓練誤差と汎化誤差の「開き（ギャップ）」を見ることで、モデルの状態を診断できます。

× 汎化誤差は直接計算できる
（解説）真の汎化誤差（あらゆる未知データに対する誤差）は理論的な値であり、直接計算することは不可能です。そのため、手元にあるデータを分割して作った「テストデータ（検証データ）」の誤差を、汎化誤差の近似値（代わり）として使います。
× 学習データだけで汎化誤差を評価できる
（解説）できません。学習に使っていないデータで試さないと、未知のデータへの対応力は測れません。必ず評価用のデータを取り分けておく必要があります。