順位カテゴリのためのスピアマンのrhoとピアソンのrの理解

これらの統計量を得るには、統計 > > クロス集計とカイニ乗を選択し、他の統計をクリックし、順位カテゴリの相関係数を選択します。

スピアマンのρとピアソンのrを用いて、順位カテゴリのある2つの変数の間の関連性を評価します。順位カテゴリは小、中、大など、自然な順位になります。

係数の範囲は-1~+1の値です。係数の絶対値が大きいほど、変数間の関係は強まります。絶対値1は完全な線形関係を意味し、値0は順位関係が存在しないことを意味します。その中間の値での相関関係の強度は、個々の場合の目的と要件に応じて解釈します。

スピアマンのρとピアソンのrの例

たとえば、新車について3レベルの継続的サービス(サービスなし、標準サービス、プレミアムサービス)を提供する自動車販売代理店の顧客満足度を分析するとします。顧客のランダムサンプルを選び出し、顧客サービスに対して不満、どちらでもない、満足のいずれであるかを尋ねます。得られるデータは、サービスパッケージと顧客満足度という2つの順位変数を含みます。顧客が享受するサービスレベルと顧客の全体的な満足度の間に関連性があるかどうかを判断します。以下の二元表にデータを入力します。
  サービスなし 標準サービス プレミアムサービス
不満足 162 104 36
どちらでもない 99 91 93
満足 39 105 171

この表でのスピアマンのρとピアソンのrはどちらも0.424です。サービスレベルと顧客満足度の間には明確な関連があると結論でき、つまりは、上位のサービス計画を選択する顧客は、この業務に対してより深い満足度を示す傾向があるということになります。

スピアマンのρとピアソンのrの重要な考慮事項

相関は因果関係を意味するわけではないことに注意します。たとえば、アイスクリームの販売と、泳いでいる人へのサメの攻撃とに正の相関がある場合、アイスクリームの消費が何らかの形でサメの攻撃を引き起こすという意味ではありません。温暖な気候などの他の変数は、アイスクリームの販売と海水浴の両方を増やす原因になる場合があります。

クロス集計とカイニ乗で計算したピアソンの統計量は、順位データだけのものです。たとえば、22、37、53という連続値は順位値1、2、3として分析されます。連続データの1つまたは2つの列に対するピアソン相関係数を計算するには、代わりに、統計 > 基本統計 > 相関を用います。

テキスト値では、カテゴリの自然な順序を表示するために、必要に応じてデフォルトの値の順序を変更します。たとえば、テキスト値の「狭(narrow)」、「中(medium)」、「広(wide)」の列に対する値の順序を変更しない限り、これらの値はアルファベット順になり、順位値2、1、3として分析されます。