のデータに関する考慮事項 固定予測変数のみでCoxモデルを適合

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

応答変数は連続量である
連続データは、小数値または十進数値を含め、連続スケールに沿った値の範囲内に入る潜在的に任意の数値となる測定値です。
応答データは故障時間です
データを収集するには、通常1つ以上の変数および/または因子で測定される異なる条件下で品目が故障するまでの時間を測定します。たとえば、異なる温度で稼働する品目の故障までの時間を測定します。
対象の応答データが、対象が危険にさらされている時間間隔によって特徴付けられる場合は、 を使用 計測プロセスフォームでのCoxモデルの適合 します。
故障時間は独立している必要があります
ある項目の故障時間は、別の項目の故障時間に影響を与えるべきではありません。観測値が従属している場合、結果は有効ではない可能性があります。たとえば、修復可能なシステムの障害発生間隔は、多くの場合独立していません。修復可能なシステムのように、対象が目的のイベントを複数回経験できるデータがある場合は、 を使用 計測プロセスフォームでのCoxモデルの適合 します。
予測変数が定量的である必要性
予測変数は、調査の開始時にその値を知っていて、スタディ期間中に変化しない場合に固定されます。例えば、被験者の発祥の地は固定予測変数です。
打ち切りデータについて考慮する必要があります
応答データはイベントまでの時間であるため、検閲や切り捨ての対象となります。Cox 回帰モデルでは、打ち切りの最も一般的な形式は右打ち切りであり、切り捨ての最も一般的な形式は左切り捨てです。どの応答時間が検閲され、無修正かを示す列を指定できます。
  • 右打ち切り: 被験者の応答時間は、被験者が調査が終了する前に関心のあるイベントを経験しない場合、または被験者がイベントを体験する前に研究から削除された場合、右打ち切りされます。たとえば、試験期間の後にユニットが機能する場合や、被験者が新しい都市に移転してスタディから撤退した場合に、打ち切られた観測が発生します。
  • 左切り捨てまたは遅延エントリ: 左切り捨ては、研究の開始時に被験者を観察しない場合に発生します。代わりに、中間イベントが発生したときに、後でスタディに含めます。被験者がスタディに入る時間は、入力時間または切り捨て時間と呼ばれます。例えば、臓器が移植可能になるまで、臓器移植の待機リストに患者を含めないでください。
異なる治療の被験者は比例率でイベントを経験する
Cox 回帰モデルでは、応答データのパラメトリック分布を指定する必要はありません。しかし、このモデルは、2つの異なる治療を受けた個人が、事象を経験する比例的な危険またはリスクを有することを前提としています。比例ハザード仮定は、ハザード比または相対リスクの観点から回帰係数を簡単に解釈します。比例ハザードの仮定が成立しない場合、相対リスク表は間違った結論を導き出すことができます。この仮定を検証するには、比例ハザードテーブル、アンダーセンプロット、およびArjasプロットの検定を使用します。
モデルは、フルランクでなければなりません。
フルランクモデルには、モデル内のすべての項を推定するために十分なデータが含まれます。データが欠損していたり、不十分である場合や、共線性が高い場合、フルランクでは問題が発生します。モデルがフルランクでない場合は、解析を実行するときに警告が表示されます。多くの場合、重要でない高次の相互作用をモデルから削除することで、この問題を解決できます。