姿勢推定 (Pose Estimation)
解説:AIで「骨格」を透視する
姿勢推定(ポーズ・エスティメーション)は、画像や動画に写っている人物の「関節点(キーポイント)」を検出し、その人がどんな姿勢をしているかを推定する技術です。
単に「人がいる」と認識する物体検出とは異なり、肩、肘、手首、膝、足首などの位置を点で捉え、それらを線で結ぶことで「骨格(スケルトン)」を可視化します。

🤸♀️ 活躍するフィールド
- スポーツ解析: プロ野球選手の投球フォームや、陸上選手の走りを数値化してコーチングに活用。
- エンタメ (VTuber): カメラで撮影した「中の人」の動きを、リアルタイムでアニメキャラに反映させる(モーションキャプチャ)。
- 行動検知: 防犯カメラで「万引きしそうな動き」や「転倒した高齢者」を検知。
代表的な手法:OpenPose
この分野で最も有名なのが、カーネギーメロン大学の研究チームなどが開発した「OpenPose」というライブラリです。
OpenPoseは、画像内に何人いても高速に解析できる「ボトムアップ方式」を採用したことで世界中に衝撃を与えました。
| アプローチ | 仕組み | 特徴 |
|---|---|---|
| トップダウン方式 (Top-down) |
①先に「人」を見つける(物体検出) ②その枠内で関節を探す |
精度は高いが、人数が増えると計算時間が倍増する。 (人が多いと遅い) |
| ボトムアップ方式 (Bottom-up) |
①先に関節(点)を全部見つける ②パズルのように点を繋いで人に復元する |
OpenPoseの手法。 人数が増えても計算時間があまり変わらない。 (人が多くても速い!) |
G検定対策
出題ポイント
- タスク定義:画像から人体の「キーポイント(関節点)」を検出し、姿勢(スケルトン)を推定する。
- OpenPose:この分野の代表的なライブラリ名。ディープラーニングを用いて複数人の姿勢をリアルタイムで推定できる。
- 応用:「モーションキャプチャ(映画・ゲーム・VTuber)」「スポーツのフォーム解析」「歩行分析(医療)」などが頻出。
ひっかけ対策
- 「物体検出の一種である」→ △ 注意。
広い意味ではそうですが、単に四角い枠(バウンディングボックス)で囲むだけの物体検出とは区別されます。「骨格(点と線)を検出する」のがポイントです。 - 「静止画でしか使えない」→ × 誤り。
動画(リアルタイム)での解析こそが、この技術の真骨頂です。
