Web教科書

LeNet

LeNet(ルネット)

解説

LeNet(ルネット)とは、1998年にヤン・ルカン(Yann LeCun)博士らによって発表された、世界初の本格的な畳み込みニューラルネットワーク(CNN)モデルです。具体的には「LeNet-5」というバージョンが有名です。

CNNの始祖とMNIST

LeNetは、手書き数字画像のデータセットMNIST(エムニスト)を認識するために開発されました。「畳み込み層」と「サブサンプリング層(現在のプーリング層に相当)」を交互に重ねる構造を採用し、郵便番号の自動読み取りや小切手の処理などで実際に活用されました。

現代のCNNとの違い

基本構造は現在のCNNと同じですが、以下の点が異なります。

  • 活性化関数現在は「ReLU」が主流ですが、当時はシグモイド関数(またはTanh)」を使用していました。
  • プーリング:現在は最大値を取る「Max Pooling」が主流ですが、当時は平均値を取る「Average Pooling(サブサンプリング)」でした。

G検定対策

出題ポイント

  • 開発者:ヤン・ルカン(Yann LeCun)。現在はメタ(Facebook)のAI研究責任者でもあります。
  • 対象:手書き数字認識(MNIST)。
  • 構造の特徴:「畳み込み層」と「サブサンプリング層」の繰り返し。
  • 歴史的位置:1998年発表。第3次AIブーム(2012年〜)よりずっと前の「第2次AIブーム」の終わり頃に作られた先駆的モデル。

よくあるひっかけ問題

  • × LeNetでは、活性化関数にReLUが使われた
    (解説)ReLUが使われ始めたのは2012年のAlexNet以降です。LeNetはシグモイド関数などです。
  • × LeNetは、1000クラスの画像分類(ImageNet)を行った
    (解説)ImageNetではなく、0〜9の数字(10クラス)の「MNIST」です。
タイトルとURLをコピーしました