変分オートエンコーダ(VAE)
解説:データを「確率の雲」に変える
変分オートエンコーダ(VAE: Variational Autoencoder)は、通常のオートエンコーダに「確率統計」の考え方を組み込んだ、データを生成できるモデル(生成モデル)です。
普通のオートエンコーダは、入力画像を「ある決まった数値のセット(点)」に圧縮します。これだと、その点を復元することしかできず、新しい画像は作れません。
一方、VAEは画像を「平均と分散を持った確率分布(雲のような範囲)」に変換します。
🎲 VAEの仕組み:サイコロを振って絵を描く
- エンコーダ:
画像の特徴を一点に決めるのではなく、「だいたいこの辺りで、広がりはこのくらい(平均 )」という確率分布を出力します。 - サンプリング:
その分布(範囲)の中から、ランダムに値を一つ選び出します(サンプリング)。
※ここが「生成」の種になります。 - デコーダ:
選ばれた値を元に、画像を復元します。

なぜ「新しい画像」が作れるのか?
学習が終わった後、エンコーダを使わずに、潜在空間(確率分布の集まり)から適当な数値をランダムに選んでデコーダに渡すと、訓練データには存在しなかった「架空の新しいデータ」が生成されます。
| 比較 | 通常のオートエンコーダ (AE) | 変分オートエンコーダ (VAE) |
|---|---|---|
| 潜在変数 | 固定された「値」 | 「確率分布」(平均と分散) |
| 主な用途 | 圧縮、ノイズ除去、異常検知 | データの生成、異常検知 |
G検定対策
出題ポイント
- エンコーダの出力:潜在変数の値を直接出すのではなく、正規分布のパラメータである「平均」と「分散」を出力する。
- 損失関数:「画像を元通りにする力(再構成誤差)」と「分布をきれいな正規分布に整える力(KLダイバージェンス / KL情報量)」の2つの和で計算される。
- Reparameterization Trick:確率的なサンプリングを行うと誤差逆伝播ができないため、計算を工夫して微分可能にするテクニックの名前。
ひっかけ対策
- × VAEはGAN(敵対的生成ネットワーク)の一種である
(解説)どちらも「生成モデル」ですが、仕組みは全く別物です。VAEは確率分布を使いますが、GANは騙し合い(競争)を使います。 - × エンコーダは潜在変数を直接出力する
(解説)直接出すのは普通のオートエンコーダです。VAEは「分布(平均・分散)」を出します。
