ワルド検定 | |||
---|---|---|---|
要因 | 自由度 | カイ二乗 | p値 |
回帰 | 1 | 7.83 | 0.005 |
投薬量(mg) | 1 | 7.83 | 0.005 |
項 | 係数 | 係数の標準誤差 | Z-値 | p値 | VIF |
---|---|---|---|---|---|
定数 | -5.25 | 1.99 | -2.64 | 0.008 | |
投薬量(mg) | 3.63 | 1.30 | 2.80 | 0.005 | 1.00 |
これらの結果では、投与量は、0.05の有意水準で統計的に有意になります。投与量の変化は、事象が起こる確率の変化と関係があると結論できます。
係数を評価して、予測変数の変化が事象が発生する可能性が高いか低いかを判断します。係数と確率の関係は、リンク関数を含む分析の方法によって変わります。一般に、係数が正の場合、予測変数が増加するにつれて事象の可能性は高くなることを示します。係数が負の場合、予測変数が増加するにつれて、事象の可能性は低くなることを示します。詳細は、2値ロジスティックモデルの当てはめと 2値ロジスティック回帰の 係数と回帰式を参照してください。
投薬量の係数は3.63であり、投薬量が多くなるほど事象が起こる確率が高くなるという関係にあります。
交互作用項が統計的に有意な場合、予測変数と応答の関係は他の予測変数の水準で変わります。こうしたケースでは、交互作用の影響の考慮なしに主効果を解釈すべきではありません。モデルの主要な影響、交互作用の影響、および曲率をより理解するには、要因プロットや応答の最適化機能を参照してください。
オッズ比が1より大きい場合、予測変数が増加するにつれて事象が発生する可能性が高くなることを示しています。オッズ比が1未満の場合、予測変数が増加するにつれて事象が発生する可能性が低くなることを示しています。
変更ユニット | オッズ比 | 95%信頼区間 | |
---|---|---|---|
投薬量(mg) | 0.5 | 6.1279 | (1.7218, 21.8087) |
これらの結果では、モデルは薬剤の用量を使用して、成人のバクテリアの有無を予測します。この例では、バクテリアのないことが事象です。それぞれの錠剤に0.5mgの用量が含まれ、研究者は0.5mgの単位の変化を使用します。オッズ比はおよそ6です。成人が錠剤を1錠ずつ増やすたびに、患者にバクテリアのないオッズが約6倍ずつ高まります。
カテゴリ予測変数では、オッズ比が予測変数の異なる2水準で発生する事象のオッズを比較します。Minitabでは、水準A、水準Bが、2列に入力され、比較の設定が行われます。水準Bは、因子の参照水準です。1より大きいオッズ比は、事象が水準Aである可能性が高いことを示します。1より小さいオッズ比は、事象が水準Aである可能性が低いことを示します。カテゴリ予測変数のコード化に関する詳細は、カテゴリ予測変数のコード化方式を参照してください。
水準A | 水準B | オッズ比 | 95%信頼区間 |
---|---|---|---|
月 | |||
2 | 1 | 1.1250 | (0.0600, 21.0834) |
3 | 1 | 3.3750 | (0.2897, 39.3165) |
4 | 1 | 7.7143 | (0.7461, 79.7592) |
5 | 1 | 2.2500 | (0.1107, 45.7172) |
6 | 1 | 6.0000 | (0.5322, 67.6397) |
3 | 2 | 3.0000 | (0.2547, 35.3325) |
4 | 2 | 6.8571 | (0.6556, 71.7169) |
5 | 2 | 2.0000 | (0.0976, 41.0019) |
6 | 2 | 5.3333 | (0.4679, 60.7946) |
4 | 3 | 2.2857 | (0.4103, 12.7323) |
5 | 3 | 0.6667 | (0.0514, 8.6389) |
6 | 3 | 1.7778 | (0.2842, 11.1200) |
5 | 4 | 0.2917 | (0.0252, 3.3719) |
6 | 4 | 0.7778 | (0.1464, 4.1326) |
6 | 5 | 2.6667 | (0.2124, 33.4861) |
これらの結果では、カテゴリ予測変数はホテルの繁忙期に入った月です。応答は、宿泊客が予約をキャンセルするかどうかです。この例では、キャンセルは事象です。水準Aが月4、水準Bが月1の時、最大のオッズ比はおよそ7.71です。これは、宿泊客が月4で予約をキャンセルするオッズは、月1で予約をキャンセルするオッズのおよそ8倍だということを示しています。
詳細は2値ロジスティックモデルの当てはめと 2値ロジスティック回帰の オッズ比を参照してください。
どの程度モデルがデータに適合するかを判断するには、モデル要約表の統計量を調べます。
モデル要約統計量と適合度統計量の多くは、データがワークシートでどのように配置されているか、行あたりで1回の試行なのか複数の試行なのか、の影響を受けます。ホスマー-レメショウ検定は、データのフォーマットの影響を受けず、フォーマット間で比較可能です。詳細は、データフォーマットが2値ロジスティック回帰の適合値に与える影響を参照してください。
逸脱R2値が大きくなるほど、データへのモデル適合度は向上します。逸脱R2は常に0%から100%の間の値になります。
逸脱R2はモデルに新しい予測変数を追加すると常に大きくなります。たとえば、最適な5つの予測変数のモデルのR2は、必ず最適な4つの予測変数のモデルと少なくとも同じ大きさになります。したがって、逸脱R2は同じ大きさのモデルの比較に最も便利です。
2値ロジスティック回帰では、データのフォーマットは逸脱R2値に影響します。逸脱R2は、通常、事象・試行フォーマットの場合に高くなります。逸脱R2値は、同じデータフォーマットのモデル間でのみ比較可能です。
適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルの値が望ましい場合でも残差プロットと適合度検定を確認してデータに対するモデルの適合度を評価する必要があります。
異なる数の予測変数をもつモデルを比較する場合は、調整済み逸脱R2を使用します。逸脱R2はモデルに予測変数を追加すると必ず大きくなります。調整済み逸脱R2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。
異なるモデルを比較する際はAIC、AICc、BICを使用します。どちらの統計量でも、小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。適合度検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。
ROC曲線下の面積の値の範囲は0.5から1です。2値モデルがクラスを完全に分類できる場合、曲線下の面積は1になります。2値モデルがランダムな割り当てよりも良くクラスを分類できない場合、曲線下の面積は0.5になります。
逸脱 (deviance) R二乗 | 逸脱 (deviance) R二乗 (調整済み) | AIC | AICc(修正済み 赤池情報量基準) | BIC(ベイズ 情報量基準) | ROC曲線下面積 |
---|---|---|---|---|---|
96.04% | 91.81% | 10.63 | 14.63 | 10.22 | 0.9398 |
これらの結果を基に、モデルは、応答変数における総変動のおよそ96.04%を説明づけます。これらのデータに関して、この逸脱R2値はモデルが良好に適合していることを示します。ROC曲線下の面積は0.9398です。この値は、モデルがデータの多くを正しく分類することを示します。追加的なモデルが異なる予測変数と適合する場合は、調整済み逸脱R2値、AIC値、AICc値、BIC値、ROC曲線下の面積を使用して、どれほどモデルがデータに適合しているかを比較します。
逸脱度が統計的に有意な場合、別のリンク関数を実行、あるいはモデル内の項を変更できます。
2値ロジスティック回帰では、データのフォーマットは各行ごとの試行の回数が変わるため、p値に影響を及ぼします。
変数 | 値 | 計数 | 事象名 |
---|---|---|---|
事象 | 事象 | 160 | 事象 |
非事象 | 340 | ||
試行 | 合計 | 500 |
検定 | 自由度 | カイ二乗 | p値 |
---|---|---|---|
逸脱 (deviance) | 2 | 3.78 | 0.151 |
ピアソン | 2 | 3.76 | 0.152 |
Hosmer-Lemeshow | 3 | 3.76 | 0.288 |
これらの結果では、応答情報表は変数列の事象と試行を表示します。これらのラベルは、データが事象・試行フォーマットにあることを示します。すべての適合度検定のp値は、通常の有意水準である0.05よりも大きいです。この検定は、二項分布が予測できないように、予測される確率が観測される確率から離れた値になることを示す根拠にはなりません。
変数 | 値 | 計数 | |
---|---|---|---|
Y | 事象 | 160 | (事象) |
非事象 | 340 | ||
合計 | 500 |
検定 | 自由度 | カイ二乗 | p値 |
---|---|---|---|
逸脱 (deviance) | 497 | 552.03 | 0.044 |
ピアソン | 497 | 504.42 | 0.399 |
Hosmer-Lemeshow | 3 | 3.76 | 0.288 |
これらの結果のデータが同じ場合、応答情報表は変数列のYを表示します。このラベルは、データが2値応答・度数フォーマットであることを示します。逸脱度検定のp値は通常の有意水準である0.05よりも低くなりますが、ホスマー-レメショウ検定は最も信頼できる検定です。ホスマー-レメショウ検定は、二項分布が予測できないように、予測される確率が観測される確率から離れた値になることを示す根拠にはなりません。