インスタンスセグメンテーション (Instance Segmentation)
解説:「個」を見極める、画像認識の最高峰
インスタンスセグメンテーションは、「物体検出(位置特定)」と「セマンティックセグメンテーション(領域分割)」を合体させた、現在最も高度なタスクです。
セマンティックセグメンテーションでは、同じ「人」なら全て同じ色で塗られてしまい、何人いるかまでは分かりませんでした。
しかし、インスタンスセグメンテーションは、同じ種類の物体であっても「Aさん」「Bさん」と個体(インスタンス)を識別し、別々の色で塗り分けます。
🤖 具体的な実用例
- ロボットの部品ピッキング:
山積みのネジの中から、ネジAとネジBの重なりを正確に認識し、1本だけを掴み上げる技術。 - 細胞カウント:
シャーレの中の無数の細胞(すべて同じ見た目)を、一つずつ個別に数え上げる医療AI。

セマンティック vs インスタンス 決定的な違い
この2つの違いを理解することが、合格への近道です。
| タスク | 処理の違い | イメージ |
|---|---|---|
| セマンティック セグメンテーション |
クラス(種類)ごとに色分け。 個体識別:しない |
重なった2匹の犬は、 「大きな1つの犬エリア」になる。 |
| インスタンス セグメンテーション |
インスタンス(個体)ごとに色分け。 個体識別:する |
重なった2匹の犬は、 「赤色の犬」と「青色の犬」に分かれる。 |
代表的モデル:Mask R-CNN
この分野で最も有名なモデルが「Mask R-CNN」です。
物体検出で有名な「Faster R-CNN」に、物体の形(マスク)を出力する枝分かれ(ブランチ)を追加した構造をしています。
G検定対策
出題ポイント
- 定義:「ピクセル単位の領域分割」+「個体の識別」を同時に行うタスク。
- Mask R-CNN:インスタンスセグメンテーションの代表的なアルゴリズム。物体検出(バウンディングボックス)と同時に、セグメンテーション(マスク)を出力する。
- 用途:「個数を数える(カウンティング)」や「重なりを認識する」必要がある場面で使われる。
ひっかけ対策
- 「セマンティックセグメンテーションとの混同」に注意。
「同じクラスの物体を区別するか?」という質問が来たら、区別するのがインスタンス、しないのがセマンティックです。 - 「Panoptic Segmentation(パノプティックセグメンテーション)」
さらに発展したタスクとして、背景(空や道路)はセマンティック、前景(人や車)はインスタンスで処理する「パノプティックセグメンテーション」という用語も存在します(余裕があれば覚えましょう)。
