インスタンスセグメンテーション - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

インスタンスセグメンテーション (Instance Segmentation)

インスタンスセグメンテーションは、「物体検出（位置特定）」と「セマンティックセグメンテーション（領域分割）」を合体させた、現在最も高度なタスクです。

セマンティックセグメンテーションでは、同じ「人」なら全て同じ色で塗られてしまい、何人いるかまでは分かりませんでした。
しかし、インスタンスセグメンテーションは、同じ種類の物体であっても「Aさん」「Bさん」と個体（インスタンス）を識別し、別々の色で塗り分けます。

🤖 具体的な実用例

この2つの違いを理解することが、合格への近道です。

タスク	処理の違い	イメージ
セマンティックセグメンテーション	クラス（種類）ごとに色分け。個体識別：しない	重なった2匹の犬は、「大きな1つの犬エリア」になる。
インスタンスセグメンテーション	インスタンス（個体）ごとに色分け。個体識別：する	重なった2匹の犬は、「赤色の犬」と「青色の犬」に分かれる。

この分野で最も有名なモデルが「Mask R-CNN」です。
物体検出で有名な「Faster R-CNN」に、物体の形（マスク）を出力する枝分かれ（ブランチ）を追加した構造をしています。

定義：「ピクセル単位の領域分割」＋「個体の識別」を同時に行うタスク。
Mask R-CNN：インスタンスセグメンテーションの代表的なアルゴリズム。物体検出（バウンディングボックス）と同時に、セグメンテーション（マスク）を出力する。
用途：「個数を数える（カウンティング）」や「重なりを認識する」必要がある場面で使われる。

「セマンティックセグメンテーションとの混同」に注意。
「同じクラスの物体を区別するか？」という質問が来たら、区別するのがインスタンス、しないのがセマンティックです。
「Panoptic Segmentation（パノプティックセグメンテーション）」
さらに発展したタスクとして、背景（空や道路）はセマンティック、前景（人や車）はインスタンスで処理する「パノプティックセグメンテーション」という用語も存在します（余裕があれば覚えましょう）。