主成分分析のデータを入力する

統計 > 多変量 > 主成分

分析のためのデータを指定し、計算する成分の数を入力して、行列のタイプを指定します。

データを入力する

変数では、分析するデータの列を指定します。入力データは2つ以上の数値列があり、各列が異なる測定値になるようにする必要があります。欠損値が含まれる列がある場合は、その行全体が無視されます。欠損値は、相関行列または共分散行列の計算から除外されます。

このワークシートの各列には、ローン申請に関する異なる情報のタイプの測度が含まれます。

C1 C2 C3 C4 C5 C6 C7 C8
収入 学歴 年齢 居住年数 勤続年数 貯蓄 負債 クレジットカード
50000 16 28 2 2 5000 1200 2
72000 18 35 10 8 12000 5400 4
61000 18 36 6 5 15000 1000 2
88000 20 35 4 4 980 1100 4
91100 18 38 8 9 20000 0 1
45100 14 41 15 14 3900 22000 4

計算すべき成分の数

Minitabに計算させたい主成分の数を入力します。変数の個数が多い場合、出力量を減らすために、成分に変数より少ない個数を指定したくなるかもしれません。どれくらいの成分の個数を入力すればいいのかわからない場合、このフィールドを空欄のままにできます。数を指定しない場合、Minitabは、成分の最大数を計算しますが、その数は変数の数と等しくなります。出力結果を使用して、どれくらいの成分数があれば元の変数の分散の大部分を説明するかを判断できます。

行列のタイプ

主成分を計算するために使用する行列のタイプを選択します。

  • 相関:変数の尺度が異なっていて、すべての変数を等しく重み付けしたいときに使用します。たとえば、1~5の尺度を使用する変数と1~10の尺度を使用する変数がある場合、相関行列を使用して尺度を標準化します。
  • 共分散:変数に同じ尺度が使われている場合、または異なる尺度でも分散が大きい変数を強調したい場合に使用します。

たとえば、いくつかのサンプルの場所にいる生物の種を数えるとします。共分散行列を選択する場合、普通種であるほど、大きな分散を示し、より強調されます。希少種は、それほど分析に影響を与えません。相関行列を選択する場合、すべての種を等しく重み付けします。このため、希少種は分析の結果に大きく寄与します。したがって、決定は、研究の目的によって変わります。