平均二乗誤差(MSE)
解説:回帰問題の「採点」の定番
平均二乗誤差(MSE: Mean Squared Error)は、売上予測や気温予測など、数値を予測する「回帰タスク」において最も標準的に使われる誤差関数(採点基準)です。
一言で言えば、「予測のズレ(誤差)を2乗して、その平均をとった値」です。値が「0」に近いほど、予測が正確であることを意味します。
【MSEの計算式】
MSE = ½ ∑ (実測値 − 予測値)2
意味:
1. 予測と正解の「差」を計算する。
2. その差を「2乗」する。
3. 全データの平均をとる。
なぜ「2乗」するのか?(重要)
単に差を引き算するだけでなく、あえて「2乗」するのには、大きな理由が2つあります。
| ① プラスに揃える |
単純な引き算だと、「+5のズレ」と「-5のズレ」を足した時に「0(完璧)」になってしまいます。 2乗することで、マイナスのズレもすべてプラスの値(正の誤差)として扱うことができます。 |
| ② 大失敗を許さない (ペナルティ) |
ここが最大の特徴です。2乗すると、数値が大きくなるほど値が跳ね上がります。
つまり、「小さなミスは許すが、大きなミス(外れ値)は厳しく罰する」という性質を持ちます。 |
G検定対策
出題ポイント
- タスクの相性:「回帰問題(数値予測)」といえば「MSE」が基本の組み合わせです。
- 計算の定義:「残差(差分)の二乗和の平均」であることを理解しておきましょう。
- 性質:誤差を2乗するため、外れ値(極端な予測ミス)の影響を非常に強く受けます。(=外れ値に弱い、とも言えます)
ひっかけ対策
- × 分類タスクで使われる
(解説)分類(犬か猫か)には「交差エントロピー誤差」を使います。 - × 2乗するのは値を小さくするため
(解説)むしろ逆で、大きな誤差を強調してペナルティを与えるためです。(符号を消す目的もあります)
