2値ロジスティックモデルの当てはめと 2値ロジスティック回帰の分散分析表

分散分析表のすべての統計量の定義と解釈について解説します。

このトピックの内容

自由度（DF）
カイ二乗
p値～回帰
p値～項
調整逸脱度
調整平均
逐次逸脱度
逐次平均
寄与度

自由度（DF）

合計自由度（DF）は、データに含まれる情報量のことです。分析では、その情報を使用して、係数の値を推定します。合計自由度DFはデータの行数から1を引いた数です。項の自由度は、その項が使う係数の数を示します。モデルの項の数を増やすと、モデルに係数が追加され、残差誤差の自由度が減少します。誤差の自由度は、モデルでは使用されていない残りの自由度です。

注

2水準要因計画またはプラケット-バーマン計画では、計画に中心点がある場合、1つの自由度は曲面性の検定に使用されます。中心点に対する項がモデルに含まれている場合、曲面性の行はモデルの一部です。中心点に対する項がモデルに含まれていない場合、曲面性の行はモデルに含まれる項を検定するのに使用される誤差の一部です。応答曲面計画および決定的スクリーニング計画では、曲面性の検定が不要になるように、二乗項を推定することができます。

カイ二乗

分散分析表の各項にはカイ二乗値があります。カイ二乗値は、項またはモデルに応答との関連があるかどうかを判断する検定統計量です。

解釈

Minitabではカイ二乗統計量を使用してp値を計算し、この値に基づいて、項およびモデルの統計的有意性を判断します。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。カイ二乗統計量が十分に大きいとp値は小さくなり、項またはモデルが統計的に有意であることを示します。

p値～回帰

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

回帰モデルに含まれる係数のうち、少なくとも1つが0とは異なるという証拠をデータが示すかどうかを判断するには、回帰のp値を有意水準と比較して帰無仮説を評価します。回帰のp値の帰無仮説は、回帰モデルに含まれる項の全ての係数が0であるという仮定です。0.05の有意水準は、実際にはすべての係数は0なのにも関わらず、少なくとも1つの係数は0とは異なると結論付ける可能性が5%であることを示しています。

p値 ≤ α：少なくとも1つの係数が0ではありません: p値が有意水準以下の場合は、少なくとも1つの係数が0ではないと結論します。
p値 > α：少なくとも1つの係数が0ではないと結論付けるだけの十分な証拠がありません: p値が有意水準より大きい場合、少なくとも1つの係数は0ではないと結論付けることはできません。

p値～項

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。

p値 ≤ α：関連性は統計的に有意である: p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α：その関連性は統計的に有意ではない: p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。; 応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。

モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。

連続予測変数が有意な場合、予測変数の係数は0ではないと結論できます。
カテゴリ予測変数が有意である場合、事象の確率が全ての因子水準で同じではないと結論付けることができます。
交互作用項が有意な場合は、予測変数と事象確率の関係がその項の他の予測変数に依存すると結論できます。
多項式の項が有意な場合は、予測変数と事象確率の関係がその予測変数の重要度に依存すると結論付けることができます。

調整逸脱度

調整済みの逸脱度は、モデル内の異なる構成要素の変動の測度です。モデルの予測変数の順序は調整済みの逸脱度の計算に影響を与えません。逸脱度は、異なる要因による逸脱度を説明する構成要素に分けられます。

回帰: 回帰モデルの調整済み逸脱度は、現在のモデルと完全モデルの差を定量化します。
項: 項の調整済み逸脱度は、項を持つモデルと完全モデルの差を定量化します。
エラー: 誤差の調整済み逸脱度は、モデルでは説明できない逸脱度を定量化します。
合計: 合計調整済み逸脱度は、モデルの調整済み逸脱度と誤差の調整済み逸脱度の和です。合計調整済み逸脱度はデータの合計逸脱度を定量化します。

解釈

Minitabでは、調整済み逸脱度を使用して項のp値を計算します。調整済み逸脱度を使用して、R²統計量を計算することもできます。通常、調整済み逸脱度ではなくp値とR²統計量を解釈します。

調整平均

調整済み平均逸脱度は、項またはモデルが各自由度の逸脱度をどれだけ説明づけるかを測定します。各項の調整済み平均逸脱度の計算では、モデル内にすべての他の項があると仮定します。

解釈

Minitabでは、カイ二乗値を使用して項のp値を計算します。通常は、調整平均平方の代わりにp値を解釈します。

逐次逸脱度

逐次逸脱度は、モデル内の異なる成分の逸脱の測度です。調整済み逸脱度と異なり、逐次逸脱度は項がモデルに入力された順序に依存します。逐次逸脱度は、異なる要因による逸脱度を説明する構成要素に分けられます。

回帰: 回帰モデルの逐次逸脱度は、現在のモデルと完全モデルの差を定量化します。

項: 項の逐次逸脱度は、項を持つモデルと完全モデルの差を定量化します。
エラー: 誤差の逐次逸脱度は、モデルでは説明できない逸脱度を定量化します。
合計: 合計逐次逸脱度は、モデルの逐次逸脱度と誤差の逐次逸脱度の和です。合計逐次逸脱度はデータの合計逸脱度を定量化します。

解釈

検定のために逐次逸脱度を「使用する」に指定すると、逐次逸脱度を使用して回帰モデルのp値と各項を計算します。通常、逐次逸脱度ではなくp値を解釈します。

逐次平均

逐次平均逸脱度は、項またはモデルが各自由度の逸脱度をどれだけ説明づけるかを測定します。逐次平均逸脱度の計算は、項がモデルに入力される順序によって決まります。

解釈

Minitabでは、逐次平均逸脱度を使用して項のp値を計算します。通常は、逐次平均平方の代わりにp値を解釈します。

寄与度

寄与度には、分散分析表の各要因が合計逐次逸脱度に寄与するパーセンテージを表示します。

解釈

パーセンテージが高い場合、応答変数の中で要因が逸脱度よりも大きな割合を占めていることを示します。回帰モデルの寄与率は逸脱度R²と同じです。

2値ロジスティックモデルの当てはめと 2値ロジスティック回帰の 分散分析表