行列プロットを使用して、2つの連続変数の間の関係を調べます。また、関係の外れ値を探します。外れ値は、ピアソン相関係数の結果に大きな影響を与える可能性があります。
関係は線形関係、単調関係か、またはどちらにも当てはまらないかを判断します。以下は、相関係数が記述する形式の種類の例です。ピアソン相関係数は線形の形式に適しています。スピアマン相関係数は単調の形式に適しています。
点はプロット上にランダムに落ちており、変数間に線形関係がないことを示しています。
線に近い点もあれば、遠い点もあり、変数間に中程度の線形関係しかないことを示しています。
点は線に近く、変数間に強い線形関係があることを示しています。1つの変数が増加したとき他方の変数も増加するため、関係は正です。
点は線に近く、変数間に強い負の関係があることを示しています。1つの変数が増加したとき他方の変数が減少するため、関係は負です。
単調関係では、変数が同じ相関方向に動く傾向がありますが、一定の割合とは限りません。線形関係では、変数は一定の割合で同じ方向に動きます。このプロットは、両方の変数が共に増大するが同じ率で増大しているわけではないことを示しています。この関係は単調ですが、線形ではありません。これらのデータのピアソン相関係数は0.843ですが、スピアマン相関の方が高く0.948です。
この例は曲線関係を示しています。変数間の関係が強くても、相関係数がゼロに近いこともあります。関係は線形でも、単調でもありません。
ピアソン相関係数を使用して、2つの連続変数の間の線形関係の強さと方向を調べます。
相関係数の範囲は-1~+1の値です。係数の絶対値が大きいほど、変数間の関係は強まります。
ピアソン相関では、絶対値が1の場合、完璧な線形関係であることを示します。0に近い相関は、変数間に線形関係がないことを示します。相関係数の符号は関係の方向を示します。2つの変数がともに増加または減少する場合、係数は正で、相関を表す線の傾きが右上がりになります。一方の変数が増加するともう一方が減少する傾向にある場合、係数は負になり、相関を表す線の傾きが右下がりになります。
相関の種類 | Pearson |
---|---|
使用中の行数 | 30 |
年齢 | 居住年数 | 勤続年数 | 貯蓄 | 借金 | |
---|---|---|---|---|---|
居住年数 | 0.838 | ||||
勤続年数 | 0.848 | 0.952 | |||
貯蓄 | 0.552 | 0.570 | 0.539 | ||
借金 | 0.032 | 0.186 | 0.247 | -0.393 | |
クレジットカード数 | -0.130 | 0.053 | 0.023 | -0.410 | 0.474 |