Web教科書

教師あり学習とは

教師あり学習 (Supervised Learning)

解説

教師あり学習とは、入力データ(問題)と、それに対応する正解データ(正解ラベル、教師データ)のセットをコンピュータに与え、その関係性を学習させる手法です。

「例題」と「答え」で学ぶ

人間がドリルで勉強するときに「問題」と「答え」を見ながら学習するのと同じです。
例えば、「犬の画像(入力)」に対して「これは犬です(正解ラベル)」という情報をセットで与え続けることで、AIは未知の画像を見ても「これは犬だ」と判断できるようになります。

「回帰」と「分類」の2大タスク

教師あり学習は、予測したいデータの種類によって大きく2つに分けられます。

  • 回帰(Regression)
    連続する「数値」を予測します。例:明日の気温、株価の予測、家賃の査定など。

  • 分類(Classification)
    不連続な「クラス(カテゴリ)」を予測します。

    例:画像が犬か猫か、メールがスパムか通常か、腫瘍が良性か悪性かなど。


G検定対策

出題ポイント

  • 定義:「入力データ」と「正解ラベル(ターゲット)」がセットになっていること。
  • タスクの区別:
    • 数値を当てるなら「回帰」(線形回帰など)。
    • カテゴリを当てるなら「分類」ロジスティック回帰、SVM、決定木など)。
  • 目的:未知のデータに対して正しく予測できる能力(汎化能力)を獲得すること。

よくあるひっかけ問題

  • × ロジスティック回帰は、回帰タスクに用いられる手法である
    (解説)これがG検定最大のひっかけです。名前に「回帰」とついていますが、実際は確率(0〜1)を計算して2値に分ける「分類タスク」に使われます。
  • × クラスタリングは、教師あり学習の代表的な手法である
    (解説)クラスタリング(k-meansなど)は、正解ラベルを使わずにデータをグループ分けする「教師なし学習」です。「分類(教師あり)」と「クラスタリング(教師なし)」の違いは頻出です。
タイトルとURLをコピーしました