5分でわかる!「正の相関」「負の相関」と「相関係数」
- ポイント
- 例題
- 練習
この動画の要点まとめ
ポイント
「正・負の相関」とは?
「正・負の相関」とは、 2つの異なるデータの関連性 を表す言葉。 あるデータの値が高ければ高いほど、もう一方のデータの値が高くなる傾向がある ときは、 正の相関である というよ。逆に、 あるデータの値が高ければ高いほど、もう一方のデータの値が低くなる傾向がある ときは、 負の相関である というよ。
前回の授業では、 2つの異なるデータを図にした「散布図」 を学習したよね。
もし、縦軸にA、横軸にBという異なる2種類のデータを散布図にしたとき、 Aの値が高ければ高いほど、Bの値も高くなる傾向 があれば、 右肩上がりに点が打たれる ことになる。したがって、 右肩上がりのグラフ は 正の相関である といえるんだ。
逆に、 Aの値が高ければ高いほど、Bの値は低くなる傾向 があれば、 右肩下がりに点が打たれる ことになる。したがって、 右肩上がりのグラフ は 負の相関である といえるんだ。
また、まったく相関関係がなく、 散布図の点が散らばっているとき は、 相関がない というよ。
「相関係数」とは?
ただし、散布図の見た目だけで「相関がある・ない」と決めてしまっては、あまり数学っぽくないよね。2種類のデータの関連度を示す指標として、 「相関係数」 があるよ。 相関係数は、正の相関が強ければ強いほど1に近づき、負の相関が強ければ強いほど-1に近づく と定められているんだ。
「正・負の相関」と「相関係数」が何を意味しているかを、このポイントでおさえておこう。
【補足】「相関係数の公式」と「共分散」
「相関係数」には、求める公式があるよ。
相関係数をr、データAの標準偏差をSA、データBの標準偏差をSB、データAとBの共分散をSABとするとき、
(相関係数r)=SAB÷SASB
「分散」については、以前に学習したとおり、 {(各データ)-(平均値)}2の和を全体の度数で割る ことで求められたよね。「共分散SAB」もそれと似ていて、 {(Aの各データ)-(Aの平均値)}{(Bの各データ)-(Bの平均値)}の和を全体の度数で割る ことで求められるんだ。この相関係数の公式も覚えておくといいよ。
今回は 「正・負の相関」と「相関係数」 について学習しよう。