オートエンコーダ - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

オートエンコーダ（自己符号化器）

オートエンコーダ（Autoencoder）は、入力されたデータを一度ギュッと圧縮し、そこから再び元のデータを復元するように学習するニューラルネットワークです。

このモデルの目標は「入力と全く同じ出力を出すこと（恒等写像）」です。「コピーするだけなら意味がないのでは？」と思うかもしれませんが、ミソなのは「途中で通り道を狭くしている（ボトルネック）」点です。

⏳ 砂時計のような構造入力層よりも中間層のニューロン数を極端に少なくします。

これにより、ネットワークは「データのノイズや無駄を削ぎ落とし、本質的な特徴だけを記憶する」ことを強制的に学習させられます。

ただ圧縮するだけでなく、その性質を利用して様々なタスクに応用されます。

用途	仕組み
次元削減	中間層のデータ（特徴量）を取り出せば、PCAのようにデータをコンパクトに表現できます。（※活性化関数を使えば非線形な圧縮が可能）
異常検知	「正常なデータ」だけで学習させます。そこに「異常なデータ」を入れると、うまく復元できず「入力と出力の差（再構成誤差）」が大きくなります。これを異常として検知します。
ノイズ除去 (Denoising)	入力にわざとノイズを乗せ、出力で「きれいな画像」になるよう学習させます。これにより、不要な汚れを消すフィルタが作れます。

× 分類問題を解くための教師あり学習である
（解説）「これは犬です」といったラベルは使いません。あくまでデータの特徴を掴むためのモデルです。
× 中間層を大きくすると性能が上がる
（解説）中間層を入力より大きくすると、単に入力データを丸暗記（コピー）するだけになり、特徴抽出ができません。小さくすることに意味があります。