画像分類 - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

画像分類 (Image Classification)

画像分類は、入力された画像全体を見て、「何が写っているか」を判断し、あらかじめ決められたカテゴリ（クラス）の中から1つのラベルを割り当てるタスクです。

人間が写真をパッと見て「これはラーメンだ」「これはカレーだ」と即答するのと同じ処理をAIに行わせます。画像認識の分野では最も基本的なタスクであり、ここから発展して「物体検出」などの高度な技術が生まれました。

📸 処理のイメージ

画像分類はあくまで「全体を見て一言で答える」タスクです。そのため、以下のことはできません。

タスク名	わかること（出力）	キーワード
画像分類 (Classification)	「何が」写っているか。 (What)	クラスラベル (Class Label)
物体検出 (Object Detection)	「何が」「どこに」あるか。 (What + Where)	バウンディングボックス (囲い枠)

「画像分類では物体の位置を特定するためにバウンディングボックスを出力する」→ × 誤り。
それは「物体検出」の説明です。画像分類は位置を特定しません。
「複数の物体が写っている場合、それぞれの位置を特定できる」→ × 誤り。
画像分類では、画像全体に対して「これはパーティの画像」のようにラベルをつけることはできますが、個々の物体の位置までは分かりません。