多重コレスポンデンス分析のデータを入力する

統計 > 多変量 > 多重コレスポンデンス分析
  1. データに合ったオプションを選択します。
    • カテゴリ(分類)変数:生データがある場合はこのオプションを選択します。その後、カテゴリ変数が含まれている列を入力します。

      このワークシートでは、性別体重喫煙活動ありにカテゴリ変数ごとの生データの値が含まれています。
      C1-T C2-T C3-T C4-T
      性別 体重 喫煙 活動あり
      男性 正規 はい はい
      女性 過体重 いいえ はい
      女性 正規 いいえ いいえ
      男性 正規 いいえ はい
      女性 低体重 いいえ いいえ
      女性 過体重 はい いいえ

    • 指標変数:データを指標変数として配置する場合、このオプションを選択します。その後、指標が含まれている列を入力します。各指標変数(列)はカテゴリ変数の1つの水準を表し、各観測値(行)は2値(カテゴリに属するときは1、カテゴリに属さないときは0)を取ります。このため、すべての列を0または1のいずれかにする必要があります。

      このワークシートでは、指標の値は、生データの表で過去に示された観測値に相当します。ワークシートのセルごとに0または1が含まれ、観測値が各カテゴリに属しているかを示しています。たとえば、行1の第1観測値は、喫煙し、物理学の定期的な活動に従事している標準体重の男性を示しています。
      C1 C2 C3 C4 C5 C6 C7 C8 C9
      女性 男性 標準体重 低体重 過体重 非喫煙 喫煙 活動性なし 活動あり
      0 1 1 0 0 0 1 0 1
      1 0 0 0 1 1 0 0 1
      1 0 1 0 0 1 0 1 0
      0 1 1 0 0 1 0 0 1
      1 0 0 1 0 1 0 1 0
      1 0 0 0 1 0 1 1 0

    この分析を行う前に、欠損しているデータのある行をワークシートから除外してください。

  2. カテゴリ名には、カテゴリ名の列を入力してカテゴリ名を割り当てることができます。名前の列はテキスト列で、長さはすべてのカテゴリ変数に含まれるカテゴリ数と同じでなければなりません。たとえば、性別(男性、女性)、髪の色(金髪、茶、黒)、年齢(20歳未満、20歳以上50歳以下、51歳以上)のカテゴリ変数があり、追加変数はないとします。カテゴリ名を割り当てるには、2 + 3 + 3 = 8のカテゴリ名を持つ列が必要となるので、この列には8つの行が含まれている必要があります。表には名前の最初の8文字だけが、グラフには完全な名前が表示されます。カテゴリ名を入力しない場合、列1、列2など、列に名前がつけられます。
  3. 成分の数では、1~カテゴリ数の数字を入力します。計算する成分があるプロットを作成できます。列プロットを表示するには、成分が少なくとも2つなければなりません。