機械学習とは何か？ - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

機械学習（Machine Learning）

1. 解説

機械学習とは、データから反復的に学習し、そこに潜むパターンや規則性を見つけ出す技術です。人間が「この場合はこうする」というルールを全て記述するのではなく、コンピュータ自身がデータからルール（モデル）を構築するのが特徴です。

G検定において最も重要なのは、機械学習が大きく「教師あり学習」「教師なし学習」「強化学習」の3つに分類される点と、それぞれの使い分けを理解することです。

機械学習の分類図

機械学習の3大分類

学習データの与え方と目的によって、以下の3つに分けられます。

分類	データの形式	目的・タスク	具体例
① 教師あり学習 (Supervised)	入力データ＋正解ラベル（問題と答えのセット）	正解を予測する・回帰（数値予測）・分類（クラス分け）	・明日の気温予測（回帰）・スパムメール判定（分類）
② 教師なし学習 (Unsupervised)	入力データのみ（正解ラベルなし）	データの構造や特徴を知る・クラスタリング・次元削減	・顧客のグルーピング・異常検知（外れ値発見）
③ 強化学習 (Reinforcement)	行動と報酬（環境からのフィードバック）	報酬を最大化する行動ルールを獲得する	・将棋や囲碁のAI ・ロボットの歩行制御

重要なキーワード：特徴量（Feature）

機械学習において、データのどの部分に着目するかを表す変数を「特徴量」と呼びます。
従来の機械学習（第2次AIブーム）では、人間が専門知識を使って「どの特徴量を使うか」を設計する必要がありました。これを特徴量エンジニアリングと言います。
（※ここが、特徴量を自動で抽出できるディープラーニングとの最大の違いです）

2. G検定対策

出題ポイント

回帰と分類の違い：
- 回帰（Regression）：連続する「数値」を予測する（例：明日の株価、家賃の価格）。
- 分類（Classification）：「カテゴリ」を予測する（例：犬か猫か、合格か不合格か）。
過学習（Overfitting）：学習データに適合しすぎて、未知のデータに対して精度が落ちてしまう状態。これを防ぐ能力を汎化性能と呼ぶ。
教師なし学習の手法：「k-means法（クラスタリング）」や「主成分分析（次元削減）」などの名称が出題されやすい。

ひっかけ対策・注意点

× 強化学習＝教師なし学習の一種
（解説）別物です。強化学習は「報酬」というフィードバックがあるため、純粋な教師なし学習とは区別されます。
× 機械学習はデータを入れれば勝手に賢くなる
（解説）従来の機械学習では、データをそのまま使うのではなく、人間による適切な前処理や特徴量の設計が不可欠です。
教師あり学習の「正解データ」：「教師データ」「ラベル」「ターゲット」などと呼ばれることもありますが、同じ意味です。