順位ロジスティック回帰の主要な結果を解釈します

順位ロジスティック回帰モデルを解釈するには、次の手順を実行します。主要な出力には、p値、係数、対数尤度、連関の測度があります。

ステップ1: モデルにおける応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意です
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではありません
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。

3つ以上の水準を持つカテゴリ因子の場合、因子の水準が因子の参照水準と異なるかどうかが係数の仮説になります。因子の有意な統計量を評価するには、2つ以上の自由度を持つ項の検定を使用します。この検定の表示方法の詳細は順位ロジスティック回帰で表示する結果を選択するを参照してください。

応答情報 変数 値 計数 再来院の可能性 高い 19 多少ある 43 低い 11 合計 73
ロジスティック回帰表 95%信頼区 係数の標 間 予測変数 係数 準誤差 z値 p値 オッズ比 下限 上限 定数 (1) -0.505898 0.938791 -0.54 0.590 定数 (2) 2.27788 0.985924 2.31 0.021 距離 -0.0470551 0.0797374 -0.59 0.555 0.95 0.82 1.12
主要な結果: p値、係数

患者の満足度アンケートの分析により、患者が来る距離と再診に来る可能性の関係を調査します。これらの結果では、距離は、0.05の有意水準で統計的に有意になります。距離の変化は、異なる事象が起こる確率の変化と関係があると結論できます。

係数を評価して、予測変数の変化が、いずれかの事象が発生する可能性が高いか低いかを判断します。係数と確率の関係は、リンク関数を含む分析の方法によって変わります。係数が正の値の場合、最初の事象とそれに近い事象が発生する可能性が、予測変数が増えるにつれて高くなります。係数が負の場合、最後の事象とそれに近い事象が発生する可能性が、予測変数が増えるにつれて高くなります。詳細は係数を参照してください。

距離の係数は約-0.05であり、距離が遠いほど「可能性はない」という応答の確率が高くなり、「可能性は非常に高い」という応答の確率は低くなる関係を示しています。

ステップ2: データに対するモデルの適合度を判断する

モデルがどの程度データに適合するかを判断するには、対数尤度と関連の測度を調べます。対数尤度の値が大きいほど、データへの適合度が向上することを示します。対数尤度の値は負なので、値が0に近づくほど、値が大きくなります。対数尤度はサンプルデータによって変わるため、異なるデータセットのモデル比較に対数尤度は使用できません。

対数尤度は、モデルに項が追加されても減少することはありません。たとえば、5つの項を持つモデルの対数尤度は、同じ項で作成可能な4項モデルよりも高いです。したがって、対数尤度は、同じサイズのモデルを比較するときに最も役立ちます。個々の項を決定するには、通常、p値に異なるlogitの項がないか確認します。

ソマーズのD値、グッドマン・クルスカイのγ、およびケンドルのτaが大きい値になった場合、これはモデルがより良い予測能力を持つことを意味しています。ソマーズのDとグッドマン・クルスカイのγは-1~1になることがあります。ケンドルのτaは-2/3~2/3になることがあります。値が最大値に近い場合、モデルが適切な予測能力を持つことを示します。値が0に近い場合、モデルには応答との予測の関係がないことを示します。モデルと応答に関係がない場合よりもパフォーマンスが下がるため、値が負になることは滅多にありません。

順位ロジスティック回帰:再来院の可能性 対 距離

リンク関数:Logit

応答情報 変数 値 計数 再来院の可能性 高い 19 多少ある 43 低い 11 合計 73
ロジスティック回帰表 95%信頼区 係数の標 間 予測変数 係数 準誤差 z値 p値 オッズ比 下限 上限 定数 (1) -0.505898 0.938791 -0.54 0.590 定数 (2) 2.27788 0.985924 2.31 0.021 距離 -0.0470551 0.0797374 -0.59 0.555 0.95 0.82 1.12

対数尤度 = -68.987

すべての傾きが0に等しい検定 自由度 G p値 1 0.328 0.567
適合度検定 方法 カイ二乗 自由度 p値 ピアソン 97.419 101 0.582 逸脱 (deviance) 100.516 101 0.495
関連性の測度: (応答変数および予測確率間) パーセ ペア 数 ント 要約測度 一致するペア 832 55.5 SomersのD 0.13 一致しないペア 637 42.5 Goodman-Kruskalのγ 0.13 同順位 30 2.0 Kendallのτa 0.07 合計 1499 100.0
主要な結果: 対数尤度、ソマーズのD、グッドマン・クルスカイのy、ケンドルのτa

たとえば、内科医の責任者の場合、患者の満足度に影響度を与える因子を研究します。1組目の結果では、患者が病院に移動する距離は、患者が再診に来ると言う可能性を予測します。対数尤度は−68.987です。ソマーズのDとグッドマン・クルスカイのyは0.13です。ケンドルのτaは0.07です。これらの値は、0に近似し、距離と応答の関係が弱いことを示しています。すべての傾きが0である検定のp値は0.05より大きいので、責任者は異なるモデルを試します。

2組目の結果では、距離と距離の二乗は両方とも予測変数です。こうしたモデルでは項の数が異なるので、これらの比較に対数尤度は使用できません。連関の測度は2番目のモデルの方が高く、2番目のモデルのパフォーマンスが1番目のモデルよりも高いことを示しています。

順位ロジスティック回帰:再来院の可能性 対 距離

* 警告 * 20回反復してもアルゴリズムが収束しませんでした。 * 警告 * 収束が対数尤度またはパラメータ推定判定基準に達していません。 * 警告 * 結果は信頼できない可能性があります。 * 警告 * 反復回数の最大値を増やしてください。

リンク関数:Logit

応答情報 変数 値 計数 再来院の可能性 低い 2 高い 3 多少ある 4 合計 9
ロジスティック回帰表 係数の標 95%信頼区間 予測変数 係数 準誤差 z値 p値 オッズ比 下限 上限 定数 (1) -8.37842 44.7209 -0.19 0.851 定数 (2) -6.68100 44.7154 -0.15 0.881 距離 3.06326 13.2432 0.23 0.817 21.40 0.00 4.00884E+12 距離*距離 -0.285089 0.962191 -0.30 0.767 0.75 0.11 4.96

対数尤度 = -292.087

すべての傾きが0に等しい検定 自由度 G p値 2 0.000 1.000
適合度検定 方法 カイ二乗 自由度 p値 ピアソン 79.970 100 0.930 逸脱 (deviance) 541.172 100 0.000
関連性の測度: (応答変数および予測確率間) パーセ ペア 数 ント 要約測度 一致するペア 274 79.2 SomersのD 0.77 一致しないペア 6 1.7 Goodman-Kruskalのγ 0.96 同順位 66 19.1 Kendallのτa 0.10 合計 346 100.0
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください