ImageNet(イメージネット)
解説
ImageNet(イメージネット)とは、スタンフォード大学のフェイフェイ・リー(Fei-Fei Li)らによって構築された、1,400万枚以上(2万カテゴリ以上)の画像を持つ世界最大規模の画像データベースです。
WordNetとの関係
ImageNetの最大の特徴は、単に画像を集めただけでなく、「WordNet(ワードネット)」という概念辞書(言葉の意味の階層構造)に基づいて分類・整理されている点です。
Amazon Mechanical Turk(アマゾン・メカニカル・ターク)というクラウドソーシングを活用し、世界中の人々が手作業で画像にタグ付け(アノテーション)を行って作られました。

AIの歴史を変えた「ILSVRC 2012」
このデータを使い、画像認識の精度を競うコンペティションが「ILSVRC(ImageNet Large Scale Visual Recognition Challenge)」です。
特に2012年の大会は歴史的な転換点となりました。ジェフリー・ヒントン率いるトロント大学のチームが開発した「AlexNet(アレックスネット)」が、ディープラーニング(CNN:畳み込みニューラルネットワーク)を用いて、2位以下に圧倒的な大差をつけて優勝したのです。
これがきっかけとなり、現在の「第3次AIブーム」が爆発的に広がりました。
G検定対策
出題ポイント
- 提唱者:フェイフェイ・リー(Fei-Fei Li)。
- 構造:シソーラス(類語辞典)である「WordNet」の階層構造に基づいている。
- 歴史的出来事:2012年のILSVRCにおける「AlexNet」の圧勝(エラー率を約26%から約16%へ劇的に改善)。
よくあるひっかけ問題
- × ImageNetは、コンペティションの名前である
(解説)違います。ImageNetは「データセット(データベース)」の名前です。コンペの名前は「ILSVRC」です。 - × 全ての画像はコンピュータが自動収集・分類した
(解説)クラウドソーシング(人力)を使って、人間がラベル付けを行いました。 - × ILSVRCでは1000万クラスの分類を行う
(解説)ImageNet全体は2万クラス以上ですが、コンペ(ILSVRC)で使われるのはそのサブセットである「1000クラス」です。
