Web教科書

機械学習とは何か?

機械学習(Machine Learning)

1. 解説

機械学習とは、データから反復的に学習し、そこに潜むパターンや規則性を見つけ出す技術です。人間が「この場合はこうする」というルールを全て記述するのではなく、コンピュータ自身がデータからルール(モデル)を構築するのが特徴です。

G検定において最も重要なのは、機械学習が大きく「教師あり学習」「教師なし学習」「強化学習」の3つに分類される点と、それぞれの使い分けを理解することです。

機械学習の分類図

機械学習の3大分類

学習データの与え方と目的によって、以下の3つに分けられます。

分類 データの形式 目的・タスク 具体例
教師あり学習
(Supervised)
入力データ + 正解ラベル
(問題と答えのセット)
正解を予測する
回帰(数値予測)
分類(クラス分け)
・明日の気温予測(回帰)
スパムメール判定(分類)
教師なし学習
(Unsupervised)
入力データのみ
(正解ラベルなし)
データの構造や特徴を知る
クラスタリング
次元削減
・顧客のグルーピング
・異常検知(外れ値発見)
強化学習
(Reinforcement)
行動と報酬
(環境からのフィードバック)
報酬を最大化する行動ルールを獲得する ・将棋や囲碁のAI
・ロボットの歩行制御

重要なキーワード:特徴量(Feature)

機械学習において、データのどの部分に着目するかを表す変数を「特徴量」と呼びます。
従来の機械学習(第2次AIブーム)では、人間が専門知識を使って「どの特徴量を使うか」を設計する必要がありました。これを特徴量エンジニアリングと言います。
(※ここが、特徴量を自動で抽出できるディープラーニングとの最大の違いです)


2. G検定対策

出題ポイント

ひっかけ対策・注意点

  • × 強化学習 = 教師なし学習の一種
    (解説)別物です。強化学習は「報酬」というフィードバックがあるため、純粋な教師なし学習とは区別されます。
  • × 機械学習はデータを入れれば勝手に賢くなる
    (解説)従来の機械学習では、データをそのまま使うのではなく、人間による適切な前処理特徴量の設計が不可欠です。
  • 教師あり学習の「正解データ」:「教師データ」「ラベル」「ターゲット」などと呼ばれることもありますが、同じ意味です。
タイトルとURLをコピーしました