2値ロジスティックモデルの当てはめ2値ロジスティック回帰の メソッド テーブル

方法表の定義と解釈について解説します。

カテゴリ予測変数のコーディング

Minitabでは、(0, 1)または(−1, 0, +1)のコード化スキームでカテゴリ変数をモデルに含むことができます。回帰分析のデフォルトは(0, 1)で、分散分析とDOEのデフォルトは(−1, 0, +1)です。どちらを選択するかでカテゴリ変数の統計的な有意性は変わりませんが、係数とその解釈方法は変わります。

解釈

表示されているコード化スキームを検証し、目的の分析が行われたことを確認してください。カテゴリ変数の係数は以下のように解釈します:

  • (0, 1)コード体系がある場合、各係数は、各水準と参照水準の差を表します。参照水準の係数は0です。
  • (0, 1, +1)コード体系がある場合、各係数は、水準平均と基準線の差を表します。

連続予測変速標準化

モデルの連続予測変数を標準化するよう指定した場合、連続予測変数の標準化表にその方法についての詳細が表示されます。

通常、標準化は変数のセンタリングかスケーリング、またはその両方の目的で行います。変数をセンタリングすると、多項式項や交互作用項によって起こる多重共線性を回避して、係数の推定の正確性を向上させることができます。ほとんどの場合、変数をスケーリングすると、変数のさまざまな尺度が共通の尺度に変換され、係数のサイズを比較できるようになります。

解釈

標準化方法の表を使い、目的の分析が行われたかどうかを検証してください。選択した方法によっては、次に示すように係数の解釈を変更する必要があるかもしれません。

最低水準と最高水準を指定して、-1および+1としてコード化
この方法では、変数を中央に寄せてスケールします。各係数は、予測変数がコード化尺度の単位ごとに変化するものとして、変換された応答平均の期待変化量を表します。たとえば、各係数は、予測変数が0から1に変化するときに、変換された応答平均の変化量を表します。
平均を引き、標準偏差で割る
この方法では、変数を中央に寄せてスケールします。各係数は、予測変数が1標準逸脱度ずつ変化するものとして、変換された応答平均の期待変化量を表します。
平均を引く
この方法では、変数がセンタリングされます。各係数は、予測変数が1ごとに変化するものとして、変換された応答平均の期待変化量を表します。
標準偏差で割る
この方法では、変数がスケーリングされます。各係数は、予測変数が1標準逸脱度ずつ変化するものとして、変換された応答平均の期待変化量を表します。
指定した値を引き、別の値で割る
この方法で変数が中央に寄せられるか、あるいはスケールされるかは、指定した値によって変わります。各係数は、予測変数が除数の値ごとに変化するものとして、変換された応答平均の期待変化量を表します。たとえば4で割る場合、係数は、元の測定尺度で4増加することを表します。

係数の正しい解釈も、リンク関数などの分析の他の様態によって変わります。

応答情報

Minitabでは、応答に関して次の情報が表示されます。
変数
応答変数の名前
応答変数の水準
計数
応答変数の各水準における観測数
合計
非欠損観測値の数。

出力は、応答のどの水準が参照事象であるかも特定します。

解釈

応答情報を使用して、分析内にあるデータ量を調べます。各水準の出現数を多く持つランダムサンプルが大きくなるほど、通常、母集団の推定は正確になります。

また、応答情報を使用して、どの事象が参照事象かを判断します。係数などの統計量とオッズ比の解釈は、どの事象が参照水準かによって変わります。

検証

テストデータセットを使用する場合、表にはテストデータセット内のデータのパーセントが示されます。クロス検証を使用すると、分割数が表に表示されます。検定データセット内の観測値または各フォールドにある観測値を指定する列を指定すると、表に列のタイトルが表示されます。

解釈

結果に含まれる検証方法を検証し、目的の分析が行われたことを確認してください。