Web教科書

姿勢推定

姿勢推定 (Pose Estimation)

解説:AIで「骨格」を透視する

姿勢推定(ポーズ・エスティメーション)は、画像や動画に写っている人物の「関節点(キーポイント)」を検出し、その人がどんな姿勢をしているかを推定する技術です。

単に「人がいる」と認識する物体検出とは異なり、肩、肘、手首、膝、足首などの位置を点で捉え、それらを線で結ぶことで「骨格(スケルトン)」を可視化します。

姿勢推定の出力イメージ
🤸‍♀️ 活躍するフィールド

  • スポーツ解析: プロ野球選手の投球フォームや、陸上選手の走りを数値化してコーチングに活用。
  • エンタメ (VTuber): カメラで撮影した「中の人」の動きを、リアルタイムでアニメキャラに反映させる(モーションキャプチャ)。
  • 行動検知: 防犯カメラで「万引きしそうな動き」や「転倒した高齢者」を検知。

代表的な手法:OpenPose

この分野で最も有名なのが、カーネギーメロン大学の研究チームなどが開発した「OpenPose」というライブラリです。
OpenPoseは、画像内に何人いても高速に解析できる「ボトムアップ方式」を採用したことで世界中に衝撃を与えました。

アプローチ 仕組み 特徴
トップダウン方式
(Top-down)
①先に「人」を見つける(物体検出)
②その枠内で関節を探す
精度は高いが、人数が増えると計算時間が倍増する。
(人が多いと遅い)
ボトムアップ方式
(Bottom-up)
①先に関節(点)を全部見つける
②パズルのように点を繋いで人に復元する
OpenPoseの手法。
人数が増えても計算時間があまり変わらない。
(人が多くても速い!)

G検定対策

出題ポイント

  • タスク定義:画像から人体の「キーポイント(関節点)」を検出し、姿勢(スケルトン)を推定する。
  • OpenPose:この分野の代表的なライブラリ名。ディープラーニングを用いて複数人の姿勢をリアルタイムで推定できる。
  • 応用:「モーションキャプチャ(映画・ゲーム・VTuber)」「スポーツのフォーム解析」「歩行分析(医療)」などが頻出。

ひっかけ対策

  • 「物体検出の一種である」→ △ 注意。
    広い意味ではそうですが、単に四角い枠(バウンディングボックス)で囲むだけの物体検出とは区別されます。「骨格(点と線)を検出する」のがポイントです。
  • 「静止画でしか使えない」→ × 誤り。
    動画(リアルタイム)での解析こそが、この技術の真骨頂です。
タイトルとURLをコピーしました