係数表 固定予測変数のみでCoxモデルを適合

係数表のすべての統計量の定義と解釈について解説します。

係数

回帰係数は、予測変数と応答変数の関係の、サイズと方向を表します。係数とは、回帰式において項の値に乗じられる数です。

解釈

予測変数の変化により事象が発生する可能性が高くなるか低くなるかを特定するには係数を使います。一般的に係数が正数の場合は事象が発生する可能性が高く、負数の場合は低くなります。予測係数が0に近い場合、予測変数の影響が小さいことを表しています。カテゴリ予測変数の場合、解釈はコーディングによって異なります。

連続予測変数
予測変数の推定係数は、予測変数の1単位分の変化に対するリンク関数の変化を表し、モデル内の他の予測変数は固定されます。
1、1.0コーディングを使用するカテゴリ予測変数
係数は、参照水準から係数の水準まで変化させた場合、オッズの自然対数の推定変化になります。たとえば、カテゴリ変数には、「早い」と「遅い」の水準があるとします。参照水準は男性です。「早い」の係数が1.3の場合、「遅い」から「早い」に変化すると、事象のオッズの自然対数は1.3増加します。
1、0、-1コーディングを使用するカテゴリ予測変数
係数は、オッズの自然対数の平均から係数の水準まで変化させた場合、オッズの自然対数の推定変化になります。たとえば、カテゴリ変数には、「変化前」と「変化後」の水準があるとします。「変化前」の係数が-2.1の場合、変数が「変化後」と等しいとき、事象のオッズの自然対数は平均から2.1減少します。

係数の標準誤差

係数の標準誤差により、同じ母集団から繰り返しサンプルを抽出する場合に得られる係数推定値間の変動を推定します。計算では、サンプルを繰り返し抽出する場合はサンプルのサイズと係数の推定値は変わらないと仮定します。

解釈

係数の標準誤差を使用して、係数の推定値の精度を測定します。標準誤差が小さいほど、推定値の精度が高くなります。

係数の信頼区間(95% CI)

信頼区間(CI)は、モデル内の各項の係数の真の値が含まれる可能性のある値の範囲です。信頼区間の計算では、正規分布を使用します。散布すのサイズが十分に大きく、サンプルの係数の分布が正規分布に従う場合、信頼区間は正確です。

データのサンプルはランダムであるため、1つの母集団からの2つのサンプルの信頼区間が同一である可能性は低くなります。しかし、ランダムなサンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
この単一値は、サンプルデータを使用して母数を推定するためのものです。信頼区間は、点推定を中心にして得られます。
誤差幅
誤差幅は、信頼区間の幅の定義に使用され、サンプル、サンプルサイズ、および信頼水準における観測された変動性によって決まります。信頼区間の上限を計算するには、誤差幅を点推定に加算します。信頼区間の下限を計算するには、点推定から誤差幅を減算します。

解釈

信頼区間を使用して、モデルの各項の母集団係数の推定値を評価します。

たとえば、信頼水準が95%の場合、信頼区間に母集団係数の値が含まれていることが95%信頼できます。信頼区間は、結果の実質的な有意性を評価するのに役立ちます。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて有用でない場合は、サンプルサイズを増やすことを検討します。

Z値

Z値は、係数とその標準誤差の間の比率を測定する検定統計量です。

解釈

Z値を使用してMinitabで計算されるp値に基づいて、項およびモデルの統計的有意性に関する決定を下すことができます。サンプルの係数の分布が正規分布に基づくようになるほどサンプルのサイズが大きい場合、この検定は正確です。

Z値が0から十分に離れている場合は、係数の推定値が、0から統計的に異なるほど十分に大きくかつ正確であることを示しています。逆に、Z値が0に近い場合は、項に効果に対する影響力があると確信するには、係数の推定値が小さすぎるか、または精度が低すぎることを示しています。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項の係数は0に等しく、項と応答に関連性がないという仮定です。通常、0.05の有意水準(αまたはアルファとも呼ばれる)が有効に機能します。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、を参照してください モデルの縮約化
モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
  • 変量因子が有意な場合は、その因子が応答の変動量に寄与していると結論できます。
  • 共変量が統計的に有意な場合、その共変量の値の変化は平均応答値の変化と関連すると結論付けることができます。
  • 交互作用項の係数が有意な場合は、因子と応答の間の関係はその項の他の因子に依存します。こうしたケースでは、交互作用の影響の考慮なしに主効果を解釈すべきではありません。
  • 多項式項の係数が有意な場合は、データに曲面性が含まれると結論付けることができます。