Web教科書

重回帰分析

重回帰分析 (Multiple Regression Analysis)

解説

重回帰分析とは、1つの目的変数(予測したい値)に対して、2つ以上の説明変数(予測の手がかりとなる値)を使って予測を行う回帰分析の手法です。

数式と「超平面」のイメージ

単回帰分析が「 y = ax + b 」という直線の式で表されるのに対し、重回帰分析は以下のような式で表されます。

y = w0 + w1x1 + w2x2 + … + wnxn + ε

  • y:目的変数(例:家賃)
  • x1, x2:説明変数(例:広さ、築年数、駅徒歩分数)
  • w1, w2偏回帰係数(それぞれの変数が結果に与える影響度)
  • ε(イプシロン):誤差項

変数が2つの場合は3次元空間内の「平面」となり、変数が3つ以上になると人間には想像しにくい多次元空間内の「超平面(Hyperplane)」としてモデル化されます。

注意点:多重共線性(マルチコ)

説明変数を増やせば増やすほど予測精度が上がるわけではありません。特に、説明変数同士に強い相関関係(例:「部屋の面積」と「畳数」など、ほぼ同じ意味の変数)があると、計算がおかしくなり、正しい係数が求まらなくなる現象が起こります。これを「多重共線性(略称:マルチコ)」と呼びます。


G検定対策

出題ポイント

  • 定義:説明変数(x)が2つ以上ある線形回帰モデル。
  • 幾何学的解釈:多次元空間における「超平面」でデータを説明する。
  • 評価指標:変数の数による有利さを補正した「自由度調整済み決定係数」を用いるのが一般的。
  • リスク:「多重共線性(Multi-Collinearity)」が発生しないように変数を選ぶ必要がある。

よくあるひっかけ問題

  • × 重回帰分析では、説明変数が多ければ多いほど良いモデルになる
    (解説)多すぎると「多重共線性」や「過学習」の原因になります。
  • × 重回帰分析の結果は、必ず曲線になる
    (解説)「線形」回帰の一種なので、基本的には直線(平面・超平面)で表現されます。曲線を表現するには、変数を2乗するなどの工夫(多項式回帰)が必要です。
タイトルとURLをコピーしました