の主要な結果を解釈する 計測プロセスフォームでのCoxモデルの適合

次の手順を実行して、カウントプロセスフォームで Cox 回帰モデルを解釈します。主要な出力には、適合度検定、p値、相対リスク、およびグラフィカル診断ツールが含まれます。

ステップ1:データに対するモデルの適合度を判断します

適合度検定を使用して、統計的分布がデータに適合するかどうかを判断します。モデルがデータに十分に適合していることが帰無仮説となります。通常、0.05の有意水準(αまたはアルファとも呼ばれる)が有効に機能します。0.05の有意水準は、実際には係数は0であるにも関わらず、0ではないと結論付けるリスクが5%であることを示しています。
p値 ≤ α:モデルは、データに適切に適合しています。
p値が有意水準以下の場合、モデル間に統計的に有意な差があると結論付けることができます。いずれかの項が統計的に有意であるかどうかを調べ、また、モデルが比例ハザードの仮定を満たしていることを確認する必要があります。
p値 > α:効果は統計的に有意であると結論付けるのに十分な証拠はありません。
p値が有意水準より大きい場合は、条件が異なることによって応答が変化すると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。

適合度検定

検定自由度カイ二乗p値
尤度比429.390.000
ワルド(Wald)432.470.000
スコア435.220.000
主要な結果: p値

これらの結果では、3 つのテストの p 値はすべて 0.05 未満であるため、モデルがデータに適合すると結論付けることができます。

ステップ 2: モデルにおける応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常、0.05の有意水準(αまたはアルファとも呼ばれる)が有効に機能します。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化 を参照してください。
モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
  • カテゴリ因子が有意である場合、因子がイベントまでの時間に影響を与える結論を出すことができます。
  • 共変量が統計的に有意な場合、その共変量の値の変化は平均応答値の変化と関連すると結論付けることができます。
  • 交互作用項の係数が有意な場合は、因子と応答の間の関係はその項の他の因子に依存します。こうしたケースでは、交互作用の影響の考慮なしに主効果を解釈すべきではありません。
  • 多項式項が有意な場合は、データに曲面性が含まれると結論付けることができます。

分散分析



ワルド検定
要因自由度カイ二乗p値
リスクカテゴリ29.770.008
通常の血小板19.130.003
病気の段階16.410.011
主要な結果: p値

これらの結果では、リスクカテゴリ のp値は0.05のαレベルで有意です。したがって、患者が リスクカテゴリ 病気にかかっているかどうかに統計的に有意な影響を及ぼすと結論付けることができる。あなたはについて同じ結論を出 通常の血小板 すことができます 病気の段階

ステップ3:予測変数の相対的なリスクを決定する

相対的なリスクを使用して、予測変数の異なる値間のリスクを評価します。Minitabには、カテゴリ変数と連続変数に対する相対的リスクの別の表が表示されます。
カテゴリ変数

カテゴリ予測変数の相対リスク表では、カテゴリ変数の2つのレベルがレベルAとレベルBにラベル付けされます。相対リスクは、レベル B に対するレベル A のイベント発生率を表します。例えば、以下の結果では、forを有する患者に対して事象を経験 ハイリスク病気の段階 するリスクは、の患者よりも2倍高い 病気の段階ノーマル

連続変数
連続予測変数の相対リスク表には、変化の単位と相対的リスクが表示されます。相対リスクは、予測変数値の 1 単位ごとのハザード率の変化を表します。例えば、変動年齢に対する相対的リスクが1.02の場合、患者は年齢に対する1年の増加ごとにイベントを経験する可能性が1.02倍高くなります。

この場合、2サンプルの比率検定を使用して、この差が統計的に有意であるかどうかを判断できます。通常、信頼区間に 1 が含まれている場合、相対的リスクが統計的に有意であると結論付けることはできません。

カテゴリ予測変数の相対的リスク

水準A水準B相対的リスク95%信頼区間
リスクカテゴリ     
  210.4524(0.2409, 0.8495)
  310.9673(0.5116, 1.8290)
  322.1383(1.2487, 3.6616)
通常の血小板     
  はいいいえ0.3666(0.1912, 0.7029)
病気の段階     
  ノーマルハイリスク0.4986(0.2909, 0.8547)
水準Bと比べた水準Aのリスク
主要な結果: 相対リスク、95% CI

ステップ4:モデルが比例ハザードの仮定を満たすかどうかを判断する

比例ハザード検定表、アンダーセンプロット、およびArjasプロットを使用して、モデルが比例ハザードの仮定を満たしているかどうかを判断します。仮定を満たさない場合、そのモデルはデータにあまり適合しない可能性があり、結果の解釈は慎重に行う必要があります。
比例ハザード表の検定

検定を使用して、モデルが比例ハザードの仮定を満たしているかどうかを判断します。帰無仮説は、モデルがすべての予測変数の仮定を満たしていることです。通常、0.05の有意水準(αまたはアルファとも呼ばれる)が有効に機能します。0.05の有意水準は、実際にはモデルによって応答の変動は説明できないにも関わらず、説明できると結論付ける可能性が5%であることを示しています。

p値が有意水準以下の場合、データは分布に従わないと結論付けることができます。p値が有意水準より大きい場合、そのモデルにより応答での変動が説明されると結論することはできません。

アンデルセンプロット

異なる地層に対する比例ハザードの仮定をモデルが満たしているかどうかを判断するには、アンダーセンプロットを使用します。1 つ以上の階層化変数の値のそれぞれの組み合わせによって、階層が定義されます。プロットには、各階層の曲線が含まれています。モデルが仮定を満たしている場合、曲線は X = 0 および Y = 0 の点を通る直線になります。地層のベースラインハザードレートがX軸上の地層のベースラインハザードレートと同じ場合、曲線はプロット上の45度基準線に従います。

モデルが仮定を満たしていない場合は、モデルが比例ハザードの仮定を満たしていない階層変数でデータを分割するかどうかを検討します。次に、データの各サブセットに対して個別の分析を実行します。個別の分析は、各サブセットの予測変数に異なる効果をもたらします。

比例ハザードの検定

自由度相関カイ二乗p値
リスクカテゴリ       
  210.07570.540.464
  31-0.11601.080.300
通常の血小板       
  はい10.02960.090.769
病気の段階       
  ノーマル1-0.12051.300.255
全体45.420.247
相関関係は、イベント時間と各項のスケーリングされたシェーンフェルト残差との間です。
主要な結果: p値

これらの結果では、比例ハザードの検定のp値はすべて0.05より大きいので、モデルが比例ハザードの仮定を満たしていないと結論付けることはできません。