エッジAI (Edge AI)
解説:現場で即断即決する「端末上のAI」
エッジAIは、インターネットの向こう側にある「クラウド(巨大なサーバー)」ではなく、ユーザーの手元にある「エッジデバイス(スマホ、自動車、監視カメラ、ロボットなど)」の中でAIの推論処理を行う技術です。
これまでのAIは、データを一度クラウドに送り、計算結果を送り返してもらう方式(クラウドAI)が主流でしたが、通信の遅れやプライバシーの問題がありました。
エッジAIは、現場(エッジ)で計算を完結させることで、これらの課題を解決します。
| 比較 | クラウドAI | エッジAI |
|---|---|---|
| 処理場所 | 遠くの巨大データセンター | 手元の端末(現場) |
| メリット | 超高性能な計算が可能。 保存容量が無制限に近い。 |
低遅延(リアルタイム)。 通信不要(オフラインでも動く)。 プライバシー保護(データを出さない)。 |
| デメリット | 通信の遅れ(レイテンシ)がある。 個人情報を送るリスクがある。 |
マシンスペックに限界があるため、大規模なモデルは動かせない。 |
モデル軽量化技術(Model Compression)
スマホやカメラなどの小さなチップでAIを動かすには、モデルを「軽く、小さく」する必要があります。以下の3つが代表的な技術です。
| 技術名 | 仕組み |
|---|---|
| 量子化 (Quantization) |
データの精度(桁数)を落とす技術。 通常「32ビット(float32)」で計算する重みを、「8ビット(int8)」などに落とすことで、精度をほぼ保ったままメモリ量を1/4などに削減できる。 |
| 蒸留 (Distillation) |
精度が高い「巨大なモデル(教師)」の知識を、「軽量なモデル(生徒)」に教え込んでコピーする技術。 |
| プルーニング (Pruning) |
「枝刈り」とも呼ばれる。ニューラルネットワークの中で、あまり役に立っていない(重みが0に近い)結合を削除してスカスカにし、計算量を減らす技術。 |
G検定対策
出題ポイント
- メリット:「リアルタイム性(低遅延)」「通信量削減」「セキュリティ向上」の3点がエッジAIの採用理由となる。
- デメリット:端末の計算リソース(CPU/GPU/メモリ)や電力に制限があるため、高性能な巨大モデルを動かすのが難しい。
- 専用チップ:エッジでの処理を高速化するために、Googleの「Edge TPU」やNVIDIAの「Jetson」などの専用ハードウェアが使われることがある。
ひっかけ対策
- × 学習も推論もすべてエッジデバイスで行う
(解説)一般的には、重たい「学習」はクラウド(高性能サーバー)で行い、完成したモデルを軽量化してエッジに転送し、「推論」のみをエッジで行います。 - × 蒸留はモデルのパラメータ数を増やす技術である
(解説)減らす(軽量化する)技術です。教師から生徒へ、コンパクトに知識を継承させます。
