判別分析のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

予測変数が定量的である必要性
予測変数ごとの測定値データが含まれる1つ以上の数値列を持つ必要があります。Minitabでは、データを使用して、予測変数と応答の関係を定義します。カテゴリ予測変数がある場合、この分析は使用できません。代わりにロジスティック回帰を使用します。
予測変数の相関は高くなるべきではない
予測変数間の相関は多重共線性と呼ばれます。多重共線性が重度の場合、または予測変数の1つ以上が実質的に一定の場合、Minitabは判別分析を実行できず、メッセージを表示します。
応答変数ではグループを指定する必要がある
最大20グループの識別子が含まれるグループ化列を1つ持つ必要があります。グループ識別子は数値、テキスト、または日付・時刻のいずれかになります。
予測変数のデータはグループごとに正常である必要性
多変量正規性は、判別分析の正式な仮説です。線形判別関数は正規性からの逸脱に対してかなり有効ですが、2次判別関数は正規性仮説の影響を受けやすくなります。予測変数が正規でない場合、ロジスティック回帰の使用を検討します。ロジスティック回帰により、これらのケースの結果はより正確になります。
可能な場合、分析の事前確率を入力します。
場合によっては、判別分析を実行する前に、観測値がグループに属する確率がわかっていることがあります。たとえば、特定の車の購入者を分類する場合に、購入者の60%が男性で、40%が女性であることを知っていることがあります。事前確率を知っているまたは推定できる場合、分析に事前確率を指定して、結果の精度を向上させます。