共分散を理解する
共分散は、2つの数値データがどのように一緒に変動しているかを表す指標です。相関係数の“元”となる概念であり、G検定でも頻出の統計用語です。
共分散の目的は「2つの変数が同じ方向に動くのか、逆方向に動くのかを知ること」です。相関係数よりも素朴な指標で、まずはここを押さえると理解がスムーズになります。
G検定では共分散の計算問題はほぼ出ませんが、共分散が正・負・ゼロのときに何を意味するのかを理解しておくと十分対応できます。
共分散とは?
共分散とは、2つの変数の偏差(平均との差)の積の平均です。これにより、2つの変数がどの方向に一緒に動くかを判断できます。まずは具体的な例を見ていきましょう。
なぜ共分散の値で方向性がわかるのかすぐに気になる方は計算方法の部分を参考にしてください。
- 共分散 > 0:正の共分散(片方が増えるともう片方も増える)
例:勉強時間が増えるとテスト点数も上がる傾向がある。

- 共分散 ≒ 0:関係が弱い(ほぼ一緒に動かない)
例:勉強時間とテスト点数にほぼ関係がない。

- 共分散 < 0:負の共分散(片方が増えるともう片方は減る)
例:勉強時間が増えるほどテスト点数が下がる(あくまでイメージ)。

共分散は「方向性」を示すだけで、数値の大きさはスケール(単位)に依存します。そこでスケールを整えたものが相関係数です。
共分散の計算方法
共分散は、偏差の積の平均で求められます。
やっていることはとてもシンプルです。
- 平均からのズレ(偏差)を求める
- 偏差同士を掛け合わせる(偏差の積)
- その平均を求める(これが共分散)
なぜこの計算式で2つの方向にいくか合わせて理解しておきましょう。

ここを詳しく読めば理解が深まって定着につながります!
「偏差の積」が意味していること
共分散の理解で一番のカギになるのが、この「偏差の積」が何を表しているかです。
まず、偏差とは「データが平均からどれだけズレているか」を表す値です。
- Xの偏差: (x – x(平均))(Xが平均より上か下か)
- Yの偏差: (y – y(平均))(Yが平均より上か下か)
この2つの偏差を掛け合わせたものが偏差の積です。偏差の積には、次の4パターンしかありません。
| Xの偏差 | Yの偏差 | 偏差の積 | 意味 |
|---|---|---|---|
| + | + | + | 両方とも平均より上にある |
| - | - | + | 両方とも平均より下にある |
| + | - | - | Xは上、Yは下 |
| - | + | - | Xは下、Yは上 |
ここからわかる重要なポイントは次の通りです。
- 偏差の積がプラス:2つの変数が「同じ方向」に動いている(両方とも平均より上、または両方とも平均より下)下の図でいうとオレンジのゾーン。
- 偏差の積がマイナス:2つの変数が「逆方向」に動いている(片方は平均より上、片方は平均より下)下の図でいうとブルーのゾーン。

共分散は、この偏差の積をすべてのデータについて平均したものです。そのため、
- 偏差の積がプラスなデータが多い:共分散は正(同じ方向に動く傾向が強い)
- 偏差の積がマイナスなデータが多い:共分散は負(逆方向に動く傾向が強い)
- プラスとマイナスが打ち消し合う:共分散は0付近(はっきりした方向性がない)
このように、偏差の積は「一つひとつの点で見たときの、XとYの動く方向」を表し、その平均である共分散が「全体としての動きの方向」を表していると理解すると、共分散の意味がぐっとクリアになります。
共分散の注意点
- 単位に依存する(例:cmとkgを使うと値が大きくなりやすい)
- 数値の大きさだけでは強さを判断できない
- 方向性(正・負)を知るための指標として使う
この「スケール依存」という弱点を解消したのが相関係数です。共分散を標準偏差で割って正規化したものが相関係数になります。
共分散と相関係数の違い
- 共分散:方向性(正・負)を示す
- 相関係数:方向性+強さを −1〜+1 の範囲で示す
- 相関係数は共分散を標準偏差で割ってスケールを整えたもの
まとめ
この記事では、G検定で頻出の「共分散」について解説しました。
- 共分散は偏差の積の平均で求められる
- 正なら同じ方向、負なら逆方向に変動する
- 数値の大きさは単位に依存するため、強さの判断には不向き
- 相関係数は共分散を正規化した指標
共分散は相関係数の基礎となる概念です。ここを理解しておくと、G検定の統計問題がぐっと読みやすくなります。
相関係数については以下の記事を参考にしてください。
相関係数 – G検定 無料問題集|解説付きでたくさん練習できる「G検定の森」
