判別分析のデータを入力する

統計 > 多変量 > 判別分析

データを入力する

  1. に、各観測値が属するグループを示す列を入力します。列には数値やテキスト、日付/時刻を設定することができ、最大20グループまで含めることができます。

    テキストグループが処理される順序をデフォルトのアルファベット順から変更する場合は、独自の順序を定義することができます。詳細は、Minitab出力でのテキスト値の表示順序の変更を参照してください。

  2. 予測変数に、グループ間の差異を判断するのに使用する数値の測定変数が含まれる列(複数可)を入力します。

このワークシートでは、コースはグループ列であり、学校の管理者が各生徒に割り当てる現在の教育トラックを示しています。テストの得点やる気は、生徒ごとの教育トラックを決定するために使用する予測変数です。
C1 C2 C3
トラック テストの得点 モチベーション
3 1021 44
2 1152 56
1 1224 61
3 1077 46
2 1149 55
2 1192 49

判別関数

分析に使用する判別関数を選択します。

  • 線形:グループに同じ共分散行列があると仮定できる場合、線形判別分析を実行します。詳細は線形判別分析とはを参照してください。
  • 2次:グループに同じ共分散行列があると仮定できない場合、2次判別分析を実行します。詳細は2次判別分析とはを参照してください。

分析を2回実行して、それぞれの判別関数を使用して、結果を比較してデータとの相性が良い関数を判断したいと考えるかもしれません。判別関数を評価するためによく使われるのは、正しい分類の比率を比較する方法です。別な方法として、既知のグループを持つ観測値を、あたかも未知のグループであるかのように処理して、判別関数がどの程度既知のグループを予測するかを判断する方法があります。

交差検証を使う

このオプションを選択して、誤判別された観測値の楽観的とも思えるほど明らかな誤差率の埋め合わせをします。明らかな誤差率は、誤判別された観測値の割合(パーセント)です。分類されたデータは、分類関数を構築するために使用されるデータと同じであるため、この数字は楽観的である傾向にあります。

交差検証により、観測値ごとに1つずつ除外して、残った観測値を使用して判別関数を計算します。その後、Minitabでは、除外された観測値のグループを予測します。正しいグループの比率が高い場合、その予測を信頼することができます。

交差検証を使用する場合、追加の要約表が表示され、誤判別された観測値の要約表に交差検証情報が追加されます。

もう1つの手法として、データを2つの部分に分割すると、より現実的な誤差率を計算できます。1つの部分は判別関数の作成に使用し、もう1つの部分は検証セットとして使用します。検証セットに対してグループ所属を予測し、誤判別されたデータのパーセントとして誤差率を計算します。

保存

分析によって得られる結果は、その他の分析、グラフ、マクロで使用できるようにワークシートに保存することができます。Minitabでは、選択された結果を、入力する列に保存します。適合値と交差検証適合値の保存列の名前の末尾は数字になっており、これらの結果を複数回保存すると、この数字が大きくなります。

線形判別関数
列を入力して、線形判別関数から係数を保存します。グループごとに列を1つ入力します。Minitabでは、関数ごとに1つの列、係数ごとに1つの行を保存します。定数は、各列の1行目に保存されます。
適合値
適合値を保存して選択します。観測値の適合値とは、それが分類されているグループです。Minitabでは、データ内の観測値ごとに1つの行と、FITS1列にグループ識別子を保存します。
交差検証からの適合値
交差検証を使用して判別に実行するときに適合値を保存するために選択します。観測値の適合値とは、それが分類されているグループです。Minitabでは、データの観測値ごとに1つの行と、XFIT1列の交差検証用グループ識別子を保存します。