順位ロジスティック回帰の主要な結果を解釈します

順位ロジスティック回帰モデルを解釈するには、次の手順を実行します。主要な出力には、p値、係数、対数尤度、連関の測度があります。

ステップ1: モデルにおける応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。

カテゴリ因子が3つ以上の水準を持つ場合、因子のこの水準が参照水準と異なるかについてが係数の仮説になります。因子の統計的有意性を評価するには、2つ以上の自由度を持つ項の検定を使用します。この検定の表示方法の詳細は順位ロジスティック回帰で表示する結果を選択するを参照してください。

応答情報

変数計数
再来院の可能性高い19
  多少ある43
  低い11
  合計73

ロジスティック回帰表







95% 信頼区間
予測変数係数係数の標準誤差z値p値オッズ比下限上限
定数 (1)-0.5058980.938791-0.540.590     
定数 (2)2.277880.9859242.310.021     
距離-0.04705510.0797374-0.590.5550.950.821.12
主要な結果: p値、係数

患者の満足度アンケートの分析により、患者が来る距離と再診に来る可能性の関係を調査します。これらの結果では、距離は有意水準0.05では統計的に有意ではありません。距離の変化は、さまざまな事象が発生する確率の変化に関連付けられていると結論付けることはできません。

係数を評価して、予測変数の変化が、いずれかの事象が発生する可能性が高いか低いかを判断します。係数と確率の関係は、リンク関数を含む分析の方法によって変わります。係数が正の値の場合、最初の事象とそれに近い事象が発生する可能性が、予測変数が増えるにつれて高くなります。係数が負の場合、最後の事象とそれに近い事象が発生する可能性が、予測変数が増えるにつれて高くなります。詳細は、係数を参照してください。

距離の係数は約-0.05であり、距離が遠いほど「可能性はない」という応答の確率が高くなり、「可能性は非常に高い」という応答の確率は低くなる関係を示しています。

ステップ2: データに対するモデルの適合度を判断する

モデルがどの程度データに適合するかを判断するには、対数尤度と関連の測度を調べます。対数尤度の値が大きいほど、データへの適合度が向上することを示します。対数尤度の値は負なので、値が0に近づくほど、値が大きくなります。対数尤度はサンプルデータによって変わるため、異なるデータセットのモデル比較に対数尤度は使用できません。

対数尤度は、モデルに項が追加されても減少することはありません。たとえば、5つの項を持つモデルの対数尤度は、同じ項で作成可能な4項モデルよりも高いです。したがって、対数尤度は、同じサイズのモデルを比較するときに最も役立ちます。個々の項を決定するには、通常、p値に異なるlogitの項がないか確認します。

ソマーズのD値、グッドマン・クルスカイのγ、およびケンドルのτaが大きい値になった場合、これはモデルがより良い予測能力を持つことを意味しています。ソマーズのDとグッドマン・クルスカイのγは-1~1になることがあります。ケンドルのτaは-2/3~2/3になることがあります。値が最大値に近い場合、モデルが適切な予測能力を持つことを示します。値が0に近い場合、モデルには応答との予測の関係がないことを示します。モデルと応答に関係がない場合よりもパフォーマンスが下がるため、値が負になることは滅多にありません。

リンク関数:Logit

応答情報

変数計数
再来院の可能性高い19
  多少ある43
  低い11
  合計73

ロジスティック回帰表







95% 信頼区間
予測変数係数係数の標準誤差z値p値オッズ比下限上限
定数 (1)-0.5058980.938791-0.540.590     
定数 (2)2.277880.9859242.310.021     
距離-0.04705510.0797374-0.590.5550.950.821.12
対数尤度 = -68.987

すべての傾きが0に等しい検定

自由度Gp値
10.3280.567

適合度検定

方法カイ二乗自由度p値
ピアソン97.4191010.582
逸脱 (deviance)100.5161010.495

関連性の測度:

(応答変数および予測確率間)
ペアパーセント要約測度
一致するペア83255.5SomersのD0.13
一致しないペア63742.5Goodman-Kruskalのγ0.13
同順位302.0Kendallのτa0.07
合計1499100.0   
主要な結果: 対数尤度、ソマーズのD、グッドマン・クルスカイのy、ケンドルのτa

たとえば、内科医の責任者の場合、患者の満足度に影響度を与える因子を研究します。1組目の結果では、患者が病院に移動する距離は、患者が再診に来ると言う可能性を予測します。対数尤度は−68.987です。ソマーズのDとグッドマン・クルスカイのyは0.13です。ケンドルのτaは0.07です。これらの値は、0に近似し、距離と応答の関係が弱いことを示しています。すべての傾きが0である検定のp値は0.05より大きいので、責任者は異なるモデルを試します。

2組目の結果では、距離と距離の二乗は両方とも予測変数です。こうしたモデルでは項の数が異なるので、これらの比較に対数尤度は使用できません。連関の測度は2番目のモデルの方が高く、2番目のモデルのパフォーマンスが1番目のモデルよりも高いことを示しています。

順位ロジスティック回帰:再来院の可能性 対 距離
リンク関数:Logit

応答情報

変数計数
再来院の可能性高い19
  多少ある43
  低い11
  合計73

ロジスティック回帰表







95% 信頼区間
予測変数係数係数の標準誤差z値p値オッズ比下限上限
定数 (1)6.386713.061102.090.037     
定数 (2)9.318833.159292.950.003     
距離-1.256080.523879-2.400.0170.280.100.80
距離*距離0.04954270.02146362.310.0211.051.011.10
対数尤度 = -66.118

すべての傾きが0に等しい検定

自由度Gp値
26.0660.048

適合度検定

方法カイ二乗自由度p値
ピアソン114.9031000.146
逸脱 (deviance)94.7791000.629

関連性の測度:

(応答変数および予測確率間)
ペアパーセント要約測度
一致するペア93862.6SomersのD0.29
一致しないペア50533.7Goodman-Kruskalのγ0.30
同順位563.7Kendallのτa0.16
合計1499100.0