のモデル要約表 固定予測変数のみでCoxモデルを適合

モデル要約表のすべての統計量の定義と解釈について解説します。

モデルの概要テーブルには 2 つの行が含まれています。1 つの行は、項のないモデルの行です。もう 1 つの行は、解析内の項を含むモデル用です。2 つの行を比較して、項なしのモデルに対する項を使用してモデルの改善を評価します。モデルのパフォーマンスを記述するには、項を含むモデルの行を使用します。AIC、AICc、BIC を使用して、ある分析から別の分析に異なる項を持つモデルを比較します。

対数尤度

対数尤度を使用して、同じデータを使用して、係数を推定する2つのモデルを比較します。値が負の場合、値が0に近づくほど、データへのモデル適合度が上がります。

対数尤度は、モデルに項が追加されても減少することはありません。たとえば、項を持つモデルは、項のないモデルよりも対数尤度が高くなります。2 つのモデル間の対数尤度値の差が大きいほど、データの適合度に対するモデルの寄与度が大きいことを示します。

2 つのモデルを項と比較すると、モデルの項数が同じ場合に、パフォーマンスの差が最も明確になります。[係数]テーブルの項のp値を使用して、モデルに含める項を決定します。

R二乗

R2は、モデルによって説明される応答の変動のパーセントです。

解釈

R2を使用して、モデルがデータにどの程度適合するかを判断します。R2値が高いほど、モデルが良好にデータに適合します。R2は常に0%から100%の間です。

R2値を解釈する際は次の問題を考慮してください。
  • R2はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。
  • サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。たとえば、より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。
  • 適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルに望ましい値がある場合でも、残差プロットを確認してモデルが仮定を満たしているかを検証する必要があります。

AIC、AICc、BIC

赤池情報量基準(AIC)、補正赤池情報量基準(AICc)、ベイズ情報量規準(BIC)は、モデルの適合度と含まれる項の数を説明する、モデルの相対的な質を測る測度です。

解釈

異なるモデルを比較する際はAIC、AICc、BICを使用します。小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。
AICcとAIC
サンプルサイズがモデル内のパラメータよりも小さい場合、AICcの性能はAICよりも良くなります。サンプルサイズがかなり小さいとき、パラメーター数が多すぎるモデルではAICは小さくなる傾向があるので、AICcの性能の方が良くなります。サンプルサイズがモデルのパラメータ数に対して十分な大きさがある場合は、通常、どちらの統計量でも同じ結果が得られます。
AICcとBIC
AICcとBICは両方とも、モデルの尤度を評価し、モデルに項を追加したときにペナルティを適用します。このペナルティにより、モデルがサンプルデータに過剰適合する傾向を減少させます。こうした減少により、通常のモデルのパフォーマンスを改善できます。
一般的なガイドラインとして、パラメーター数がサンプルサイズよりも少ない場合、BICにおける各パラメーターの追加に対するペナルティはAICcよりも大きくなります。これらのケースでは、BICを最小化するモデルは、AICcを最小化するモデルよりも小さくなる傾向があります。
スクリーニング計画などのよくある一部のケースでは、一般的に、パラメーター数はサンプルサイズよりも多くなります。これらのケースでは、AICcを最小化するモデルは、BICを最小化するモデルよりも小さくなる傾向があります。たとえば、実行数が13の決定的スクリーニング計画では、AICcを最小化するモデルは、6個以上のパラメーターを持つ1組のモデル内ではBICを最小化するモデルよりも小さくなる傾向があります。
AICc と BIC の詳細については、バーナムとアンダーソンを参照してください。1
1 Burnham, K. P., & Anderson, D. R. (2004). Multimodel inference:Understanding AIC and BIC in model selection. Sociological Methods & Research, 33(2), 261-304. doi:10.1177/0049124104268644