Web教科書

VAE

変分オートエンコーダ(VAE)

解説:データを「確率の雲」に変える

変分オートエンコーダ(VAE: Variational Autoencoder)は、通常のオートエンコーダに「確率統計」の考え方を組み込んだ、データを生成できるモデル(生成モデル)です。

普通のオートエンコーダは、入力画像を「ある決まった数値のセット(点)」に圧縮します。これだと、その点を復元することしかできず、新しい画像は作れません。
一方、VAEは画像を「平均と分散を持った確率分布(雲のような範囲)」に変換します。

🎲 VAEの仕組み:サイコロを振って絵を描く

  1. エンコーダ:
    画像の特徴を一点に決めるのではなく、「だいたいこの辺りで、広がりはこのくらい(平均 )」という確率分布を出力します。
  2. サンプリング:
    その分布(範囲)の中から、ランダムに値を一つ選び出します(サンプリング)。
    ※ここが「生成」の種になります。
  3. デコーダ:
    選ばれた値を元に、画像を復元します。

なぜ「新しい画像」が作れるのか?

学習が終わった後、エンコーダを使わずに、潜在空間(確率分布の集まり)から適当な数値をランダムに選んでデコーダに渡すと、訓練データには存在しなかった「架空の新しいデータ」が生成されます。

比較 通常のオートエンコーダ (AE) 変分オートエンコーダ (VAE)
潜在変数 固定された「値」 「確率分布」(平均と分散)
主な用途 圧縮、ノイズ除去、異常検知 データの生成、異常検知

G検定対策

出題ポイント

  • エンコーダの出力:潜在変数の値を直接出すのではなく、正規分布のパラメータである「平均」と「分散」を出力する。
  • 損失関数:「画像を元通りにする力(再構成誤差)」と「分布をきれいな正規分布に整える力(KLダイバージェンス / KL情報量)」の2つの和で計算される。
  • Reparameterization Trick:確率的なサンプリングを行うと誤差逆伝播ができないため、計算を工夫して微分可能にするテクニックの名前。

ひっかけ対策

  • × VAEはGAN(敵対的生成ネットワーク)の一種である
    (解説)どちらも「生成モデル」ですが、仕組みは全く別物です。VAEは確率分布を使いますが、GANは騙し合い(競争)を使います。
  • × エンコーダは潜在変数を直接出力する
    (解説)直接出すのは普通のオートエンコーダです。VAEは「分布(平均・分散)」を出します。
タイトルとURLをコピーしました