Web教科書

エッジ AI

エッジAI (Edge AI)

解説:現場で即断即決する「端末上のAI」

エッジAIは、インターネットの向こう側にある「クラウド(巨大なサーバー)」ではなく、ユーザーの手元にある「エッジデバイス(スマホ、自動車、監視カメラ、ロボットなど)」の中でAIの推論処理を行う技術です。

これまでのAIは、データを一度クラウドに送り、計算結果を送り返してもらう方式(クラウドAI)が主流でしたが、通信の遅れやプライバシーの問題がありました。
エッジAIは、現場(エッジ)で計算を完結させることで、これらの課題を解決します。

比較 クラウドAI エッジAI
処理場所 遠くの巨大データセンター 手元の端末(現場)
メリット 超高性能な計算が可能。
保存容量が無制限に近い。
低遅延(リアルタイム)
通信不要(オフラインでも動く)。
プライバシー保護(データを出さない)。
デメリット 通信の遅れ(レイテンシ)がある。
個人情報を送るリスクがある。
マシンスペックに限界があるため、大規模なモデルは動かせない。

モデル軽量化技術(Model Compression)

スマホやカメラなどの小さなチップでAIを動かすには、モデルを「軽く、小さく」する必要があります。以下の3つが代表的な技術です。

技術名 仕組み
量子化
(Quantization)
データの精度(桁数)を落とす技術。
通常「32ビット(float32)」で計算する重みを、「8ビット(int8)」などに落とすことで、精度をほぼ保ったままメモリ量を1/4などに削減できる。
蒸留
(Distillation)
精度が高い「巨大なモデル(教師)」の知識を、「軽量なモデル(生徒)」に教え込んでコピーする技術。
プルーニング
(Pruning)
「枝刈り」とも呼ばれる。ニューラルネットワークの中で、あまり役に立っていない(重みが0に近い)結合を削除してスカスカにし、計算量を減らす技術。

G検定対策

出題ポイント

  • メリット:「リアルタイム性(低遅延)」「通信量削減」「セキュリティ向上」の3点がエッジAIの採用理由となる。
  • デメリット:端末の計算リソース(CPU/GPU/メモリ)や電力に制限があるため、高性能な巨大モデルを動かすのが難しい。
  • 専用チップ:エッジでの処理を高速化するために、Googleの「Edge TPU」やNVIDIAの「Jetson」などの専用ハードウェアが使われることがある。

ひっかけ対策

  • × 学習も推論もすべてエッジデバイスで行う
    (解説)一般的には、重たい「学習」はクラウド(高性能サーバー)で行い、完成したモデルを軽量化してエッジに転送し、「推論」のみをエッジで行います。
  • × 蒸留はモデルのパラメータ数を増やす技術である
    (解説)減らす(軽量化する)技術です。教師から生徒へ、コンパクトに知識を継承させます。
タイトルとURLをコピーしました