ロジスティック回帰 - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

ロジスティック回帰（Logistic Regression）

ロジスティック回帰は、名前に「回帰」とついていますが、実際には「分類問題」（特に二値分類）に使われる代表的なアルゴリズムです。ここがG検定で最も狙われやすいポイントです。

この手法は、あるデータが特定のクラスに属するかどうかを「0か1か」で直接出力するのではなく、「そのクラスに属する確率（0〜1の範囲）」として計算するのが特徴です。その確率が設定した基準（閾値）を超えた場合に「正解（1）」と判定します。

ロジスティック回帰が答えを出すまでの流れを整理すると以下のようになります。

ステップ	処理内容	キーワード
1. 線形結合	入力データに重みを掛けて足し合わせる。（この時点では値は -∞ 〜 +∞ ）	線形モデル
2. 確率変換	ステップ1の値を0〜1の範囲に押し込める。「確率70%」のような数値になる。	シグモイド関数
3. クラス判定	確率が基準（閾値）を超えているかで判定。例：50%以上なら「合格」、未満なら「不合格」	閾値（Threshold）

ロジスティック回帰の心臓部となる関数です。どんな入力値が来ても、滑らかなS字カーブを描いて必ず 0.0 〜 1.0 の間に変換する性質を持っています。これにより出力を「確率」として扱うことが可能になります。

【最頻出】名前の罠：
「ロジスティック回帰」という名前ですが、回帰問題（数値予測）ではなく分類問題に使います。
- × 家賃の価格を予測する（これは線形回帰）
- ◯ スパムメールかどうか判定する（これはロジスティック回帰）
多クラス分類への応用：
基本は二値分類ですが、「ソフトマックス関数」などを使うことで、3つ以上のクラス分類にも応用可能です。