2値ロジスティック回帰診断

モデル化手順の後は、通常、モデルを検証します。統計 > 回帰 > 2値ロジスティック回帰 > 2値ロジスティックモデルの適合には、診断プロットの集合、適合度検定など、モデルを検証するための診断測度があります。残差などの診断統計量は、以下の潜在的な問題を見つけやすくします。
  • 許容される適合値を持たない因子・共変量パターン
  • パラメータ推定値に強い影響を与える因子・共変量パターン
  • 大きなてこ比を持つ因子・共変量パターン

Minitabには、次の表に一覧表示されるとおり、これらの潜在的な問題ごとに異なるオプションが用意されています。Hosmer、Lemeshow1では、モデルの潜在的な問題を理解するために、これらの診断を併せて解釈することを示しています。

潜在的な問題 診断統計量 統計量の定義
許容される適合値を持たない因子・共変量パターン ピアソン残差 実際の観測値と予測観測値の間の差
標準化されたピアソン残差 実際の観測値と予測観測値の間の差、ただしσ = 1となるように標準化される
逸脱残差 逸脱残差、逸脱カイ二乗の成分
⊿χ2(デルタカイ二乗) j番目の因子・共変量パターンが取り除かれた場合のピアソンカイ二乗の変化
⊿逸脱度 j番目の因子・共変量パターンが取り除かれた場合の逸脱の変化
パラメータ推定値に強い影響を与える因子・共変量パターン ピアソン残差で計算する⊿ベータ j番目の因子・共変量パターンが取り除かれた場合の係数の変化
標準化されたピアソン残差で計算する⊿ベータ j番目の因子・共変量パターンが取り除かれた場合の係数の変化
大きなてこ比を持つ因子・共変量パターン てこ比(Hi) j番目の因子・共変量パターンのてこ比、異常な予測変数値の測度

残差プロットを使用して、これらの診断の一部を視覚化できます。その他の診断も、保存してプロットできます。⊿カイ二乗と⊿逸脱度は、モデルをあまり適合しない因子・共変量パターンを識別するのに役立ちます。⊿ベータ統計量は、パラメータ推定値に強い影響を与える因子・共変量パターンを識別するのに役立ちます。一般に、推定される事象確率またはてこ比に対してこれらの⊿統計量をプロットします。推定される事象確率はデータとモデルが与えられた事象の確率です。てこ比は予測変数値がどれだけ異常かを評価します。グラフ上で点を識別するには、Minitabのグラフブラッシング機能を使用します。

1 Hosmer, D.W.、Lemeshow, S.(2000)、『Applied Logistic Regression』第2版、John Wiley and Sons, Inc.