要因計画の2値応答の分析の主要な結果を解釈する

要因計画を分析するには、次の手順を実行します。主要な出力は、パレート図、p値、係数、モデル要約統計量、残差プロットです。

ステップ1:応答に対して最大の効果を持つ項を特定する

標準化効果のパレート図を使用すると、主効果および交互作用両方の相対的重要度および統計的有意性を比較することができます。

Minitabでは、標準化効果をその絶対値の降順でプロットします。図上の参照ラインは、どの効果が有意であるかを示します。デフォルトでは、有意水準0.05で参照ラインが引かれます。

主要な結果:パレート図

この結果では、防腐剤の種類(A)、真空封止圧力(B)、汚染度(C)の3つの主効果は統計的に有意です(α = 0.05)。

また、防腐剤の種類(A)は最も長く伸びているため、これが最大の効果を持つこともわかります。冷却温度相互作用(AD)による防腐剤の効果の伸びは最も短いため、効果は最小です。

ステップ2:応答に対して統計的に有意な効果を持つ項を特定する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項の係数は0に等しく、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。
モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
  • 因子の係数が有意である場合、事象の確率が全ての因子水準で同じではないと結論付けることができます。
  • 共変量の係数が有意な場合は、変数の値の変化が確率の変化と関連付けられています。
  • 交互作用項の係数が有意な場合は、因子と応答の間の関係はその項の他の因子に依存します。こうしたケースでは、交互作用の影響の考慮なしに主効果を解釈すべきではありません。
  • ブロックの係数が統計的に有意である場合、ブロックのリンク関数は平均値と異なると論付けることができます。

コード化係数

効果係数係数の標準誤差VIF
定数  -2.73700.0479 
防腐剤0.44970.22490.04771.03
真空プレス0.25740.12870.04771.06
汚染レベル0.29540.14770.04781.06
冷却温度-0.1107-0.05540.04781.07
防腐剤*真空プレス-0.0233-0.01170.04731.05
防腐剤*汚染レベル0.07220.03610.04741.06
防腐剤*冷却温度0.00670.00340.04721.05
真空プレス*汚染レベル-0.0430-0.02150.04691.04
真空プレス*冷却温度-0.0115-0.00580.04651.02
汚染レベル*冷却温度0.15730.07860.04671.02
主要な結果:係数

これらの結果では、防腐剤、真空プレス、汚染度の主効果の係数は正の数値です。低温の主効果の係数は負の数値です。一般的に、項の値が増加するにつれ、係数が正の場合は事象の可能性は高くなり、係数が負の場合は事象の可能性は低くなります。

分散分析

要因自由度調整偏差調整平均カイ二乗p値
モデル1046.21304.621346.210.000
  防腐剤122.683522.683522.680.000
  真空プレス17.33137.33137.330.007
  汚染レベル19.62099.62099.620.002
  冷却温度11.34411.34411.340.246
  防腐剤*真空プレス10.06080.06080.060.805
  防腐剤*汚染レベル10.57800.57800.580.447
  防腐剤*冷却温度10.00510.00510.010.943
  真空プレス*汚染レベル10.21060.21060.210.646
  真空プレス*冷却温度10.01530.01530.020.902
  汚染レベル*冷却温度12.84752.84752.850.092
誤差50.96740.1935   
合計1547.1804     
主要な結果:p値

これらの結果では、防腐剤、真空プレス、汚染度に対する主効果は、α = 0.05の有意水準において統計的に有意です。この結果から、これらの変数の変化は応答変数の変化に関連付けられていると結論付けることができます。

交互作用の項は統計的に有意ではありません。各変数と応答の関係は、他の変数の値に依存しない可能性があります。

ステップ3:予測変数の効果を理解する

オッズ比を使用して、予測変数の影響を理解します。オッズ比の解釈は、予測変数がカテゴリ変数か連続変数かによって変わります。Minitabは、モデルがロジットリンク関数を使用する場合にオッズ比を計算します。
連続予測変数のオッズ比

オッズ比が1より大きい場合、予測変数が増加するにつれて事象が発生する可能性が高くなることを示しています。オッズ比が1未満の場合、予測変数が増加するにつれて事象が発生する可能性が低くなることを示しています。

連続予測変数のオッズ比

変更ユニットオッズ比95%信頼区間
投薬量(mg)0.56.1279(1.7218, 21.8087)
主要な結果:オッズ比

これらの結果では、モデルは薬の投与水準を使用して、成人の体内のバクテリアの有無を予測します。この例ではバクテリアがないことが事象に該当します。各錠剤に0.5mgの投与量があるので、研究者は0.5mgの単位変化を使用します。オッズ比はおよそ6です。成人が服用する錠剤を追加する度に、患者にバクテリアがないというオッズは約6倍増加します。

カテゴリ予測変数のオッズ比

カテゴリ変数の場合、オッズ比は、予測変数の2つの異なる水準に出現する事象のオッズを比較します。水準Aと水準Bの2つの列に水準を登録することによって比較を設定できます。水準Bは因子の参照水準です。オッズ比が1より大きい場合、事象は水準Aになる可能性が高くなることを示します。オッズ比が1未満の場合、事象は水準Aになる可能性が低くなることを示します。カテゴリ予測変数のコーディングに関する詳細はカテゴリ予測変数のコード化方式を参照してください。

カテゴリ予測変数のオッズ比

水準A水準Bオッズ比95%信頼区間
     
  211.1250(0.0600, 21.0834)
  313.3750(0.2897, 39.3165)
  417.7143(0.7461, 79.7592)
  512.2500(0.1107, 45.7172)
  616.0000(0.5322, 67.6397)
  323.0000(0.2547, 35.3325)
  426.8571(0.6556, 71.7169)
  522.0000(0.0976, 41.0019)
  625.3333(0.4679, 60.7946)
  432.2857(0.4103, 12.7323)
  530.6667(0.0514, 8.6389)
  631.7778(0.2842, 11.1200)
  540.2917(0.0252, 3.3719)
  640.7778(0.1464, 4.1326)
  652.6667(0.2124, 33.4861)
水準Bと比べた水準Aのオッズ比
主要な結果:オッズ比

この結果では、カテゴリ予測変数はホテルの繁忙期の開始月です。応答は、宿泊客が予約をキャンセルするかどうかです。この例ではキャンセルは事象です。最大オッズ比は7.71で、水準Aが4か月目のときと水準Bが1か月目のときが当てはまります。これは、宿泊客が4か月目に予約をキャンセルするオッズは、宿泊客が1か月目に予約をキャンセルするオッズよりも約8倍高いことを示しています。

ステップ4:データに対するモデルの適合度を判断する

データに対するモデルの適合度を判断するために、モデル要約表の適合度統計量を調査します。

モデル要約統計量や適合度統計量の多くは、ワークシート内のデータの配置や各行で試行が1回なのか複数回なのかによって影響されます。ホスマー-レメショウ検定は、データの配置に影響されず、行ごとで1回の試行の場合と複数の試行の場合とで比較されます。詳細はデータフォーマットが2値ロジスティック回帰の適合値に与える影響を参照してください。

逸脱度R二乗

逸脱R2値が大きくなるほど、データへのモデル適合度は上がります。逸脱R2は必ず0~100%の間の値になります。

逸脱度R2はモデルに新しい項を追加すると必ず大きくなります。たとえば、最適な5項モデルのR2は必ず、最適な4項モデルと少なくとも同じ大きさになります。したがって、逸脱度R2値は同じ大きさのモデルの比較に最も便利です。

データの配置は逸脱度R2値に影響します。逸脱度R2は通常、行ごとに試行が1回の場合のデータより複数の試行の場合のデータの方が高くなります。逸脱度R2値は同じデータフォーマットのモデル間でのみ比較可能です。

適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルの値が望ましい場合でも残差プロットと適合度検定を確認してデータに対するモデルの適合度を評価する必要があります。

逸脱度R二乗(調整済み)

異なる数の項を持つモデルを比較する場合は、調整済み逸脱度R2を使用します。逸脱度R2はモデルに項を追加すると必ず大きくなります。調整済み逸脱度R2値にはモデルに含まれる項の数が組み入れられるため、正しいモデルの選択に役立ちます。

AIC、AICc、BIC

異なるモデルを比較する際はAIC、AICc、BICを使用します。いずれの統計量でも、小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。適合度検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。

モデル要約

逸脱
(deviance)
R二乗
逸脱
(deviance)
R二乗 (調整済み)
AICAICc(修正済み
赤池情報量基準)
BIC(ベイズ
情報量基準)
97.95%76.75%105.98171.98114.48
主要な結果:逸脱度R二乗、逸脱度R二乗(調整済み)、AIC

これらの結果を基に、モデルは、応答変数における合計逸脱度のおよそ97.95%を説明づけます。これらのデータでは、逸脱度R2の値は、モデルがデータに十分に適合することを示しています。追加モデルが異なる予測変数と適合する場合、調整済み逸脱度R2の値、AICの値、AICcの値、BICの値を使用して、追加モデルがどの程度データに適合するかを比較します。

ステップ5:データに適合しないモデルかどうかを判断する

適合度検定を使用し、二項分布が予測できない方法で、予測される確率が観測される確率から離れた値であるかを判断します。適合度検定のp値が、選択した有意水準よりも低い場合、二項分布が予測できないように、予測確率が観測確率から逸脱した値になります。逸脱の一般的な原因は次の通りです。
  • 不適切なリンク関数
  • モデル内にある変数の高次項が省略されています
  • モデル内にはない予測変数が省略されています
  • 過分散

逸脱度が統計的に有意な場合、別のリンク関数を実行、あるいはモデル内の項を変更できます。

次の統計量では適合度を検定します。逸脱度とピアソン統計量は、ワークシートのデータの並べ方、1行当たりの試行回数が1回なのか複数回なのかに影響を受けます。
  • 逸脱度:逸脱度検定のp値では、1行当たりの試行回数が1回に配置されているデータの方が、試行回数が複数回のデータよりも低い傾向があり、一般的には、試行回数が少なくなるほどp値も減少します。データフォーマットが1試行/行の場合は、ホスマー-レメショウ検定の結果の信頼度がより高くなります。
  • ピアソン:ピアソン検定で使用する近似カイ二乗分布は、データに含まれる行ごとの事象の期待数が小さい場合は不正確になります。それゆえ、データのフォーマットが1試行/行の場合、ピアソンの適合度検定は不正確となります。
  • ホスマー-レメショウ(Hosmer-Lemeshow):ホスマー-レメショウ検定は他の適合度検定のように、データ内の行ごとの試行回数にも左右されません。データの各行の試行回数がほとんどない場合、ホスマー-レメショウ検定は、データに対するモデルの適合度を示す指標として、信頼度が高まります。

応答情報

変数計数事象名
損傷事象506Event
  非事象7482 
コンテナ合計7988 

適合度検定

検定自由度カイ二乗p値
逸脱 (deviance)50.970.965
ピアソン50.970.965
Hosmer-Lemeshow60.101.000
事象 試行フォーマットの主要な結果:応答情報、逸脱度検定、ピアソン検定、ホスマー-レメショウ検定

これらの結果では、すべての適合度検定のp値は、通常の有意水準である0.05よりも大きいです。この検定は、二項分布が予測できないように、予測される確率が観測される確率から離れた値になることを示す根拠にはなりません。