Web教科書

ImageNet

ImageNet(イメージネット)

解説

ImageNet(イメージネット)とは、スタンフォード大学のフェイフェイ・リー(Fei-Fei Li)らによって構築された、1,400万枚以上(2万カテゴリ以上)の画像を持つ世界最大規模の画像データベースです。

WordNetとの関係

ImageNetの最大の特徴は、単に画像を集めただけでなく、「WordNet(ワードネット)」という概念辞書(言葉の意味の階層構造)に基づいて分類・整理されている点です。
Amazon Mechanical Turk(アマゾン・メカニカル・ターク)というクラウドソーシングを活用し、世界中の人々が手作業で画像にタグ付け(アノテーション)を行って作られました。

AIの歴史を変えた「ILSVRC 2012」

このデータを使い、画像認識の精度を競うコンペティションがILSVRC(ImageNet Large Scale Visual Recognition Challenge)」です。
特に2012年の大会は歴史的な転換点となりました。ジェフリー・ヒントン率いるトロント大学のチームが開発したAlexNet(アレックスネット)が、ディープラーニングCNN:畳み込みニューラルネットワーク)を用いて、2位以下に圧倒的な大差をつけて優勝したのです。
これがきっかけとなり、現在の「第3次AIブーム」が爆発的に広がりました。


G検定対策

出題ポイント

  • 提唱者:フェイフェイ・リー(Fei-Fei Li)。
  • 構造:シソーラス(類語辞典)である「WordNet」の階層構造に基づいている。
  • 歴史的出来事:2012年のILSVRCにおける「AlexNet」の圧勝(エラー率を約26%から約16%へ劇的に改善)。

よくあるひっかけ問題

  • × ImageNetは、コンペティションの名前である
    (解説)違います。ImageNetは「データセット(データベース)」の名前です。コンペの名前は「ILSVRC」です。
  • × 全ての画像はコンピュータが自動収集・分類した
    (解説)クラウドソーシング(人力)を使って、人間がラベル付けを行いました。
  • × ILSVRCでは1000万クラスの分類を行う
    (解説)ImageNet全体は2万クラス以上ですが、コンペ(ILSVRC)で使われるのはそのサブセットである「1000クラス」です。
タイトルとURLをコピーしました