順位ロジスティック回帰のロジスティック回帰表

ロジスティック回帰表のすべての統計量の定義と解釈について解説します。

このトピックの内容

係数
係数の標準誤差
Z値
p値
オッズ比
オッズ比の信頼区間（95% CI）
自由度が1を超える項の検定
対数尤度
すべての傾きがゼロの検定

係数

順位ロジスティック回帰は、モデルに含まれる各項の係数を推定します。モデルに含まれる項の係数は、結果カテゴリごとに同じです。

また、順位ロジスティック回帰は、すべての結果カテゴリの1つずつに対して定係数を推定します。定係数は、変数の係数との組み合わせで、2値回帰式を形成します。1番目の式は、1番目の事象が発生する確率を推定します。2番目の式は、1番目または2番目の事象が発生する確率を推定します。3番目の式は、1番目、2番目、3番目の事象が発生する確率を推定します。Minitabでは、これらの定係数はConst (1)、Const (2)、Const (3)という具合に名前が付けられます。

解釈

係数を使用して、予測変数の変化に伴い特定の順位結果の確率がどのように変化するかを調べます。予測変数の推定係数は、予測変数の1単位分の変化に対するリンク関数の変化を表し、モデル内の他のすべての予測変数は固定されます。係数と結果の確率の関係は、モデル内にあるリンク関数、応答カテゴリの順位、カテゴリ変数の参照水準を含む分析の方法によって変わります。一般的に、係数が正の値の場合、最初の事象とそれに近い事象が発生する可能性が、予測変数が増えるにつれて高くなります。係数が負の場合、最後の事象とそれに近い事象が発生する可能性が、予測変数が増えるにつれて高くなります。推定係数が0に近い場合、予測変数の影響は小さいことを示します。

たとえば、患者の満足度アンケートの分析により、患者が来る距離と再診する可能性の関係を調査します。最初の事象は、応答情報表の最初のものです。この場合、最初の事象は「可能性は非常に高い」、最後の事象は「可能性はない」です。距離の係数が負の場合、距離が増えるにつれて、患者が「可能性はない」と答える可能性は高くなることを示します。

応答情報

変数	値	計数
再来院の可能性	高い	19
	多少ある	43
	低い	11
	合計	73

ロジスティック回帰表

						95% 信頼区間
予測変数	係数	係数の標準誤差	z値	p値	オッズ比	下限	上限
定数 (1)	-0.505898	0.938791	-0.54	0.590
定数 (2)	2.27788	0.985924	2.31	0.021
距離	-0.0470551	0.0797374	-0.59	0.555	0.95	0.82	1.12

カテゴリ変数の場合、変化はロジスティック回帰表にある参照水準から予測変数の水準までです。一般的に、係数が正の場合、最初の事象は、因子の参照水準よりもロジスティック回帰表にある因子の水準で起こる可能性の方が高くなることを示しています。係数が負の場合、最後の事象は因子の参照水準よりもロジスティック回帰表にある因子の水準で起こる可能性の方が高くなることを示しています。

たとえば、患者の満足度アンケートの分析により、患者の雇用状況と再診に来る可能性の関係を調査します。最初の事象は「可能性は非常に高い」、最後の事象は「可能性はない」です。雇用状況は「就業」または「無職」になります。予測変数の参照水準は、ロジスティック回帰表にはありませんが、「就業」になります。「無職」の水準を持つ係数が負の場合、無職の患者が「可能性はない」と応答する可能性は、就業中の患者よりも高くなります。

応答情報

変数	値	計数
再来院の可能性	高い	19
	多少ある	43
	低い	11
	合計	73

ロジスティック回帰表

						95% 信頼区間
予測変数	係数	係数の標準誤差	z値	p値	オッズ比	下限	上限
定数 (1)	-0.707512	0.352815	-2.01	0.045
定数 (2)	2.12316	0.444672	4.77	0.000
雇用状況
無職	-0.631468	0.471078	-1.34	0.180	0.53	0.21	1.34

注

定係数は、予測変数の項を組み合わせて確率を推定します。ワークシート内にある観測値のこれらの確率は、分析が実行されたときに保存できます。詳細は順位ロジスティック回帰の統計量を保存するを参照してください。

係数の標準誤差

係数の標準誤差により、同じ母集団から繰り返しサンプルを抽出する場合に得られる係数推定値間の変動を推定します。計算では、サンプルを繰り返し抽出する場合はサンプルのサイズと係数の推定値は変わらないと仮定します。

解釈

係数の標準誤差を使用して、係数の推定値の精度を測定します。標準誤差が小さいほど、推定値の精度が高くなります。

Z値

Z値は、係数とその標準誤差の間の比率を測定する検定統計量です。

解釈

Z値を使用してMinitabで計算されるp値に基づいて、項およびモデルの統計的有意性に関する決定を下すことができます。サンプルの係数の分布が正規分布に基づくようになるほどサンプルのサイズが大きい場合、この検定は正確です。

Z値が0から十分に離れている場合は、係数の推定値が、0から統計的に異なるほど十分に大きくかつ正確であることを示しています。逆にZ値が0に近い場合は、係数の推定値が小さすぎる、または精度が低すぎて、項が応答に対して影響を及ぼすとは確信できないことを示しています。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項の係数は0に等しく、項と応答に関連性がないという仮定です。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。

p値 ≤ α：関連性は統計的に有意です: p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α：その関連性は統計的に有意ではありません: p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。; 応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。

モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は次のとおりです。

連続予測変数が有意な場合、応答水準の確率が予測変数によって変化すると結論できます。
カテゴリ予測変数が有意な場合、応答水準では、因子の水準における発生確率は、因子の参照水準よりも異なります。
交互作用項が有意な場合は、予測変数と応答水準確率の間の関係がその項の他の予測変数に依存すると結論できます。
多項式の項が有意な場合は、予測変数と応答水準確率の関係が予測変数の大きさに依存すると結論できます。

オッズ比

オッズ比では2つの事象のオッズを比較します。事象のオッズ比は、事象の発生確率を事象が発生しない確率で割った数です。モデルにlogitリンク関数を使用するとオッズ比が計算されます。

解釈

オッズ比を使用して、予測変数の影響を理解します。オッズ比の解釈は、予測変数がカテゴリ変数か連続変数かによって変わります。

連続予測変数のオッズ比

オッズ比が1よりも大きい場合、予測変数が増加するにつれて、最初の事象やそれに近い事象が起こる可能性が高くなることを示しています。オッズ比が1未満の場合、予測変数が増加するにつれて、最後の事象やそれに近い事象が起こる可能性が高くなることを示しています。

たとえば、患者の満足度アンケートの分析により、患者が来る距離と再診に来る可能性の関係を調査します。最初の事象は、応答情報表の最初にあります。この場合、最初の事象は「可能性は非常に高い」、最後の事象は「可能性はない」です。0.95という距離のオッズ比により、距離が増えるにつれて、患者が「可能性はない」と応答する可能性は高くなることがわかります。患者の移動距離が1マイル増える度に、患者が、「可能性は若干ある」または「可能性はない」の代わりに、「可能性は非常に高い」と応答するオッズが約5％減少します。

応答情報

変数	値	計数
再来院の可能性	高い	19
	多少ある	43
	低い	11
	合計	73

ロジスティック回帰表

						95% 信頼区間
予測変数	係数	係数の標準誤差	z値	p値	オッズ比	下限	上限
定数 (1)	-0.505898	0.938791	-0.54	0.590
定数 (2)	2.27788	0.985924	2.31	0.021
距離	-0.0470551	0.0797374	-0.59	0.555	0.95	0.82	1.12

カテゴリ予測変数のオッズ比

カテゴリ変数の場合、オッズ比は、予測変数の2つの異なる水準に出現する事象のオッズを比較します。オッズ比が1より大きい場合、最初の事象とそれに近い事象は、予測変数の参照水準よりもロジスティック回帰表の予測変数の水準に出現する可能性が高くなることを示しています。オッズ比が1未満の場合、最後の事象とそれに近い事象は、参照水準よりもロジスティック回帰表の予測変数の水準で出現する可能性が高くなることを示しています。

たとえば、患者の満足度アンケートの分析により、患者の雇用状況と再診に来る可能性の関係を調査します。最初の事象は「可能性は非常に高い」、最後の事象は「可能性はない」です。あり得る雇用状況は「就業」または「無職」です。予測変数の参照水準は、ロジスティック回帰表にはありませんが、「就業」です。オッズ比が1未満のため、就業中の患者が、再診に来る「可能性は非常に高い」と応答する可能性は無職の患者よりも高いです。無職の患者が「可能性は若干ある」または「可能性はない」の代わりに「可能性は非常に高い」と応答するオッズ比は、就業中の患者が「可能性は非常に高い」と応答するオッズ比の53%です。また、無職の患者が「可能性はない」の代わりに「可能性は非常に高い」または「可能性は若干ある」と応答するオッズ比は、就業中の患者が「可能性は非常に高い」または「可能性は若干ある」と応答するオッズ比の53%です。

応答情報

変数	値	計数
再来院の可能性	高い	19
	多少ある	43
	低い	11
	合計	73

ロジスティック回帰表

						95% 信頼区間
予測変数	係数	係数の標準誤差	z値	p値	オッズ比	下限	上限
定数 (1)	-0.707512	0.352815	-2.01	0.045
定数 (2)	2.12316	0.444672	4.77	0.000
雇用状況
無職	-0.631468	0.471078	-1.34	0.180	0.53	0.21	1.34

注

オッズ比ではカテゴリの順位を使用するため、オッズ比は、適切でない順位のカテゴリのオッズがどう変化するかを説明できません。例えば、患者が「可能性は非常に高い」「可能性はない」の代わりに「可能性は若干ある」と応答するオッズ比の変化を説明できません。任意の順位のカテゴリをモデル化するには、名義ロジスティック回帰を使用します。

オッズ比の信頼区間（95% CI）

信頼区間（CI）は、オッズ比の真の値が含まれている可能性のある値の範囲です。信頼区間の計算では、正規分布を使用します。標本のオッズ比の分布が正規分布に基づくようになるほどサンプルサイズが大きい場合、信頼区間は正確です。

データのサンプルはランダムであるため、1つの母集団からの2つのサンプルの信頼区間が同一である可能性は低くなります。しかし、ランダムなサンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合（%）を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。

点推定: 点推定は、サンプルデータから算出されるパラメータの推定値です。
誤差幅: 誤差幅は信頼区間の幅を定義し、事象確率やサンプルサイズ、信頼水準の影響を受けます。

解釈

信頼区間を使用すると、オッズ比のパラメータの推定値を評価できます。

たとえば、信頼水準が95%の場合、信頼区間に母集団のオッズ比の値が含まれていることが95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルサイズを増加させることを検討します。

自由度が1を超える項の検定

この検定は、カテゴリ変数に対するすべての係数を同時に考慮した全体の検定です。検定は、3つ以上の水準を持つカテゴリ変数のためにあります。

解釈

この検定を使用して、複数の係数を持つカテゴリ変数が、応答事象と統計的に有意な関係があるかどうかを判断します。カテゴリ変数が2つの水準よりも大きい場合、それぞれの水準の係数は異なるp値を持ちます。全体の検定は、予測変数が統計的に有意かどうかについて、1つの解を与えます。

応答事象とカテゴリ変数の関係が統計的に有意かどうか判断するには、検定のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、予測変数と応答事象の間には関連性がないという仮定です。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が有効に機能します。0.05の有意水準は、実際には関連性が存在しない場合に、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。

p値 ≤ α: 関連性は統計的に有意です: p値が有意水準以下の場合は、応答変数と予測変数の間に統計的に有意な関連性が存在すると結論できます。
p値 > α: その関連性は統計的に有意ではありません: p値が有意水準より大きい場合は、応答変数と予測変数の間に統計的に有意な関連性があると結論することはできません。

対数尤度

推定係数の最適値を見つけるため、対数尤度関数が最大化されます。

解釈

対数尤度を使用して、同じデータを使用して、係数を推定する2つのモデルを比較します。値が負の場合、値が0に近づくほど、データへのモデル適合度が上がります。

対数尤度は、モデルに項が追加されても減少することはありません。たとえば、5つの項を持つモデルの対数尤度は、同じ項で作成可能な4項モデルよりも高いです。したがって、対数尤度は、同じサイズのモデルを比較するときに最も役立ちます。個々の項を決定するには、通常、p値に異なるlogitの項がないか確認します。

すべての傾きがゼロの検定

この検定は、モデル内の予測変数に対するすべての係数を考慮した全体の検定です。

解釈

検定を使用して、モデル内の少なくとも1つの予測変数が、応答事象と統計的に有意な関連があるかどうかを判断します。通常、G統計量または自由度（DF）を解釈します。自由度は、モデル内の予測変数の係数の数と等しいです。

モデルにおける応答事象と予測変数の間の関係が統計的に有意かどうか判断するには、検定のp値と有意水準を比較して帰無仮説を評価します。帰無仮説は、モデル内の予測変数のすべての係数がゼロであるということで、応答事象といずれの予測変数との間にも関連性が存在しないことを示しています。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が有効に機能します。0.05の有意水準は、実際には関連が存在しない場合に、関連が存在すると結論付けてしまうリスクが5%であるということを示します。

p値 ≤ α: 関連性は統計的に有意です: p値が有意水準以下の場合は、応答変数と少なくとも1つの予測変数の間に統計的に有意な関連性が存在すると結論できます。
p値 > α: その関連性は統計的に有意ではありません: p値が有意水準より大きい場合は、応答変数といずれかの項の間に統計的に有意な関連性があると結論することはできません。