Web教科書

混同行列

混同行列(コンフュージョン・マトリックス)

解説:4つの象限で理解する

混同行列(Confusion Matrix)は、AIの予測結果を「真の状態(正解)」と「検査結果(予測)」の2軸で整理した表です。分類モデルの性能を詳細に分析するために使われます。

検査結果(AIの予測)
陽性 (Positive) 陰性 (Negative)
真の状態
(Actual)
陽性
(Positive)
真陽性 (TP)
True Positive
正解!(病気を発見)
偽陰性 (FN)
False Negative
見逃し (病気なのに健康)
陰性
(Negative)
偽陽性 (FP)
False Positive
誤検知 (健康なのに病気)
真陰性 (TN)
True Negative
正解!(健康と判定)

覚え方:「T/F」と「P/N」の組み合わせ

  • 前半 (True/False): AIの予測が当たったか (True)、外れたか (False)。
  • 後半 (Positive/Negative): AIが「陽性」と予測したか、「陰性」と予測したか。

例えば「偽陽性 (False Positive)」なら、「陽性(Positive)と予測したけど、それは間違い(False)だった」=「健康な人を病気と言ってしまった(誤検知)」となります。

指標の計算(Precision / Recall / Accuracy)

混同行列を使って、以下の重要な指標を計算できます。

  • 正解率 (Accuracy): 全体のうち、正解した割合。
    (TP + TN) ÷ 全体
  • 適合率 (Precision): AIが「陽性」と言ったもののうち、本当に陽性だった割合。「オオカミ少年にならない確率」。
    TP ÷ (TP + FP)
  • 再現率 (Recall): 本当に「陽性」であるもののうち、AIが見つけられた割合。「見逃さない確率」。
    TP ÷ (TP + FN)
  • F値 (F-measure): 適合率と再現率の調和平均(バランス)。

G検定対策

出題ポイント

  • 混同行列の配置:問題によっては「行と列が逆」で出題されることもあります。位置で暗記せず、「交差している意味」で判断できるようにしましょう。
  • トレードオフ:一般に、適合率を上げようとすると再現率が下がり、再現率を上げようとすると適合率が下がる関係にあります。
  • ROC曲線混同行列の指標を用いて描かれる性能評価グラフ。
タイトルとURLをコピーしました