姿勢推定 - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

姿勢推定 (Pose Estimation)

姿勢推定（ポーズ・エスティメーション）は、画像や動画に写っている人物の「関節点（キーポイント）」を検出し、その人がどんな姿勢をしているかを推定する技術です。

単に「人がいる」と認識する物体検出とは異なり、肩、肘、手首、膝、足首などの位置を点で捉え、それらを線で結ぶことで「骨格（スケルトン）」を可視化します。

🤸‍♀️ 活躍するフィールド

この分野で最も有名なのが、カーネギーメロン大学の研究チームなどが開発した「OpenPose」というライブラリです。
OpenPoseは、画像内に何人いても高速に解析できる「ボトムアップ方式」を採用したことで世界中に衝撃を与えました。

アプローチ	仕組み	特徴
トップダウン方式 (Top-down)	①先に「人」を見つける（物体検出） ②その枠内で関節を探す	精度は高いが、人数が増えると計算時間が倍増する。（人が多いと遅い）
ボトムアップ方式 (Bottom-up)	①先に関節（点）を全部見つける ②パズルのように点を繋いで人に復元する	OpenPoseの手法。人数が増えても計算時間があまり変わらない。（人が多くても速い！）

「物体検出の一種である」→ △ 注意。
広い意味ではそうですが、単に四角い枠（バウンディングボックス）で囲むだけの物体検出とは区別されます。「骨格（点と線）を検出する」のがポイントです。
「静止画でしか使えない」→ × 誤り。
動画（リアルタイム）での解析こそが、この技術の真骨頂です。