量子化 - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

量子化 (Quantization)

量子化（クオンタイゼーション）は、AIモデルのパラメータ（重み）や計算に使われる数値の「表現精度（ビット数）」をあえて落とすことで、モデルを軽量化・高速化する手法です。

通常、AIの学習や推論は「32bit 浮動小数点（FP32）」という非常に細かいメモリを使って計算されます。しかし、エッジデバイス（スマホなど）で動かす場合、そこまでの精密さはオーバースペックなことが多いです。
そこで、データを「粗く」することで、ファイルサイズを劇的に圧縮します。

定規の目盛りの例え

量子化なし (FP32)：
「12.3456789 cm」まで測れる超精密な定規を使う。
→ 正確だが、データを記録するノート（メモリ）がすぐに埋まる。計算も大変。
量子化あり (INT8)：
「12 cm」くらい大雑把な定規を使う。
→ 多少のズレ（誤差）は出るが、ノートは節約でき、計算も暗算レベルで爆速になる。

最も一般的なのは、32bit（浮動小数点）から8bit（整数）への変換です。

規格	データサイズ	特徴
FP32 (Single Precision)	100% (基準)	通常のPCやクラウドでの学習に使われる。非常に高精度。
FP16 (Half Precision)	50% (1/2)	「半精度」と呼ばれる。精度低下をほとんど起こさずに半分のサイズにできるため人気。
INT8 (Integer)	25% (1/4)	「整数」に変換する。劇的に軽くなるが、丸め誤差による精度低下のリスクがある。