2値ロジスティックモデルの当てはめの方法

目的の方法または計算式を選択してください。

因子/共変量パターン

データセット内の1組の因子/共変量の値を説明します。因子/共変量パターンごとに、事象確率、残差、およびその他の診断測定値が計算されます。

たとえば、データセットに性別や人種の因子、年代の共変量が含まれている場合、これらの予測変数の組み合わせには、統計対象と同じ数のさまざまな共変量パターンが含まれている可能性があります。データセットに人種や性別の因子のみが含まれ、それぞれ2つの水準でコード化されている場合は、4つの因子/共変量パターンしかありません。データを、頻度または成功、試行、もしくは失敗として入力する場合、各行には1つの因子/共変量パターンが含まれます。

の内部重み 2値ロジスティックモデルの当てはめ

一般線型モデルの場合、重みを指定しない場合、重みの行列は恒等行列ではありません。内部重みは、より多くのデータをもつ観測値に対する分析へより大きな影響を与えると考えることができます。たとえば、ロジスティック回帰の適合では、試行回数が多い場合に内部重みが大きくなる傾向があります。

計算式

次式は、特定のリンク関数の内部重みを与えます。
Logit
Normit
Gompit

表記

用語説明
mithe number of trials for the i番目 row
the predicted probability for the design point in a binary logistic model
yithe number of events for the i番目 row
the inverse cumulative distribution function of the standard normal distribution for the predicted probability in a binary logistic model

2値ロジスティックモデルの当てはめで回帰式から高い相関を持つ予測変数を取り除く方法

rijが、XiとXjに関連付けられ、現在は取り除かれた行列の要素だとします。

変数は一度に一つずつ入力されるか、削除されます。Xkは、現時点ではrkk ≥ 1(デフォルトの公差は0.0001)を持つモデルにはない独立変数である場合は入力候補となり、現在モデルにあるXjの各変数の候補にもなります。

相関の高い予測変数を回帰式から取り除くには、Minitabで次の手順を実行します。
  1. Minitabでは、X1 … Xpをあたかもランダム変数であるかのように処理する相関行列Rに対して、SWEEP法を実行します。
  2. 連続予測変数の場合、rkk ≥ 公差(k = 1~p)として、要素rkkを公差と比較します。
  3. Xjの各変数がモデル内に現在ある場合は(rjj – rjk * (rkj / rkk)) * 公差 ≤ 1であるかどうかチェックされます。

    ここでは、rkk、rjk、rjjは、kステップにおけるSWEEP操作の後に、XjとXkに対応する対角要素と非対角要素です。

  4. そうでない場合、予測値は検定に不合格となり、モデルから削除されます。

    デフォルトの公差の値は8.8e–12です。

GZLMセッションコマンドでTOLERANCEサブコマンドを使用すると、別の予測変数と相関が高い予測変数をモデル内に保持するように強制できます。ただし、公差を下げると、数値結果が不正確となる可能性があるため危険です。