混同行列(コンフュージョン・マトリックス)
解説:4つの象限で理解する
混同行列(Confusion Matrix)は、AIの予測結果を「真の状態(正解)」と「検査結果(予測)」の2軸で整理した表です。分類モデルの性能を詳細に分析するために使われます。
| 検査結果(AIの予測) | |||
|---|---|---|---|
| 陽性 (Positive) | 陰性 (Negative) | ||
| 真の状態 (Actual) |
陽性 (Positive) |
真陽性 (TP) True Positive 正解!(病気を発見) |
偽陰性 (FN) False Negative 見逃し (病気なのに健康) |
| 陰性 (Negative) |
偽陽性 (FP) False Positive 誤検知 (健康なのに病気) |
真陰性 (TN) True Negative 正解!(健康と判定) |
|
覚え方:「T/F」と「P/N」の組み合わせ
- 前半 (True/False): AIの予測が当たったか (True)、外れたか (False)。
- 後半 (Positive/Negative): AIが「陽性」と予測したか、「陰性」と予測したか。
例えば「偽陽性 (False Positive)」なら、「陽性(Positive)と予測したけど、それは間違い(False)だった」=「健康な人を病気と言ってしまった(誤検知)」となります。
指標の計算(Precision / Recall / Accuracy)
混同行列を使って、以下の重要な指標を計算できます。
- 正解率 (Accuracy): 全体のうち、正解した割合。
(TP + TN) ÷ 全体 - 適合率 (Precision): AIが「陽性」と言ったもののうち、本当に陽性だった割合。「オオカミ少年にならない確率」。
TP ÷ (TP + FP) - 再現率 (Recall): 本当に「陽性」であるもののうち、AIが見つけられた割合。「見逃さない確率」。
TP ÷ (TP + FN) - F値 (F-measure): 適合率と再現率の調和平均(バランス)。
G検定対策
出題ポイント
- 混同行列の配置:問題によっては「行と列が逆」で出題されることもあります。位置で暗記せず、「交差している意味」で判断できるようにしましょう。
- トレードオフ:一般に、適合率を上げようとすると再現率が下がり、再現率を上げようとすると適合率が下がる関係にあります。
- ROC曲線:混同行列の指標を用いて描かれる性能評価グラフ。
