2値適合線プロットのモデル要約統計量

モデル要約表のすべての統計量の定義と解釈について解説します。

逸脱度R二乗

逸脱R2は通常、モデルが説明する応答変数の逸脱の比率と考えられます。

解釈

逸脱R2値が大きくなるほど、モデルのデータに対する適合度は上がります。逸脱R2は必ず0~100%の間の値になります。

逸脱R2はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、逸脱R2値は同じ大きさのモデルを比較する際に最も有益です。

逸脱R2は、データに対する適合度を測る、一つの測度にすぎません。モデルのR2が大きい場合でも、残差プロットと適合度検定を確認し、データに対するモデルの適合度を評価する必要があります。

適合線プロットを使用して、異なる逸脱度R2をグラフで図示できます。1番目のプロットでは、応答の逸脱度のおよそ96%を説明するモデルが図示されます。2番目のプロットでは、応答の逸脱度の約60%を説明するモデルが図示されます。モデルが説明する逸脱度が大きいほど、データ点はより曲線に近いカーブを描きます。理論的には、モデルによって逸脱度の100%を説明できる場合、適合値は必ず観測値と等しくなり、すべてのデータ点が曲線上にプロットされることになります。

データのフォーマットは逸脱R2値に影響します。逸脱R2は通常、データのフォーマットが事象/試行の場合に高くなります。逸脱R2値は同じデータフォーマットのモデル間でのみ比較が可能です。詳細は、データフォーマットが2値ロジスティック回帰の適合値に与える影響を参照してください。

逸脱度R二乗(調整済み)

調整済み逸脱R2はモデルで説明される応答の逸脱の比率で、観測値数と比較してモデルに含まれる予測変数に応じて調整されています。

解釈

予測変数の数が異なるモデルを比較するには、調整済み逸脱R2を使用します。逸脱R2はモデルに予測変数を追加すると必ず大きくなります。調整済み逸脱R2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

たとえば、ポテトチップ製造会社が、砕けたポテトチップに影響する因子を調べるとします。予測変数を追加すると、以下の結果が得られます。
ステップ ポテトの割合 冷却率 調理温度 逸脱度R2 調整済み逸脱度R2 p値
1 X     52% 51% 0.000
2 X X   63% 62% 0.000
3 X X X 65% 62% 0.000

最初のステップでは、統計的に有意な回帰モデルが生成されます。2番目のステップでは、モデルに冷却率が追加されて、調整済み逸脱度R2が上昇します。このことから冷却率がモデルを改善することがわかります。3番目のステップでは、調理温度がモデルに追加され、逸脱度R2は上昇しますが、調整済みR2は上昇しません。これらの結果から、調理温度はモデルを改善しないことがわかります。こうした結果に基づいて、モデルからの調理温度の削除を検討します。

2値ロジスティック回帰の場合、データのフォーマットが調整済み逸脱度R2の値に影響を与えます。同じデータの場合、調整済み逸脱度R2は通常、データが事象/試行フォーマット内にある場合は、2値応答/頻度フォーマット内にある場合よりも大きくなります。調整済み逸脱度R2は、同じデータフォーマットのモデルの適合度を比較する場合にのみ使用してください。詳細はデータフォーマットが2値ロジスティック回帰の適合値に与える影響を参照して下さい。

赤池情報量基準(AIC)

赤池の情報量基準はモデルの適合度と含まれる項の数を説明する、モデルの相対的な質を測る測度です。統計量の解釈には比較値が必須です。

解釈

異なるモデルを比較する際はAICを使用します。AICが小さいほどモデルのデータに対する適合度は上がります。しかし、予測変数セットに対してAICが最小であるモデルは、データに必ずしも良好に適合しません。適合度検定と残差プロットも使用し、データに対するモデルの適合度を評価してください。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください