エッジ AI - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

エッジAI (Edge AI)

エッジAIは、インターネットの向こう側にある「クラウド（巨大なサーバー）」ではなく、ユーザーの手元にある「エッジデバイス（スマホ、自動車、監視カメラ、ロボットなど）」の中でAIの推論処理を行う技術です。

これまでのAIは、データを一度クラウドに送り、計算結果を送り返してもらう方式（クラウドAI）が主流でしたが、通信の遅れやプライバシーの問題がありました。
エッジAIは、現場（エッジ）で計算を完結させることで、これらの課題を解決します。

比較	クラウドAI	エッジAI
処理場所	遠くの巨大データセンター	手元の端末（現場）
メリット	超高性能な計算が可能。保存容量が無制限に近い。	低遅延（リアルタイム）。通信不要（オフラインでも動く）。プライバシー保護（データを出さない）。
デメリット	通信の遅れ（レイテンシ）がある。個人情報を送るリスクがある。	マシンスペックに限界があるため、大規模なモデルは動かせない。

スマホやカメラなどの小さなチップでAIを動かすには、モデルを「軽く、小さく」する必要があります。以下の3つが代表的な技術です。

技術名	仕組み
量子化 (Quantization)	データの精度（桁数）を落とす技術。通常「32ビット（float32）」で計算する重みを、「8ビット（int8）」などに落とすことで、精度をほぼ保ったままメモリ量を1/4などに削減できる。
蒸留 (Distillation)	精度が高い「巨大なモデル（教師）」の知識を、「軽量なモデル（生徒）」に教え込んでコピーする技術。
プルーニング (Pruning)	「枝刈り」とも呼ばれる。ニューラルネットワークの中で、あまり役に立っていない（重みが0に近い）結合を削除してスカスカにし、計算量を減らす技術。

メリット：「リアルタイム性（低遅延）」「通信量削減」「セキュリティ向上」の3点がエッジAIの採用理由となる。
デメリット：端末の計算リソース（CPU/GPU/メモリ）や電力に制限があるため、高性能な巨大モデルを動かすのが難しい。
専用チップ：エッジでの処理を高速化するために、Googleの「Edge TPU」やNVIDIAの「Jetson」などの専用ハードウェアが使われることがある。

× 学習も推論もすべてエッジデバイスで行う
（解説）一般的には、重たい「学習」はクラウド（高性能サーバー）で行い、完成したモデルを軽量化してエッジに転送し、「推論」のみをエッジで行います。
× 蒸留はモデルのパラメータ数を増やす技術である
（解説）減らす（軽量化する）技術です。教師から生徒へ、コンパクトに知識を継承させます。