決定的スクリーニング計画の分析の主要な結果を解釈する

スクリーニング計画を分析するには、次の手順を実行します。主要な出力は、パレート図、p値、係数、モデル要約統計量、および残差プロットです。

ステップ1:応答の変動性に最も寄与する項を特定する

標準化効果のパレート図を使用すると、効果の相対的重要度および統計的有意性を比較することができます。

Minitabでは、標準化効果をその絶対値の降順でプロットします。図上の参照ラインは、どの効果が統計的に有意であるかを示します。

主要な結果:パレート図

これらの結果では、モデルにある項が青い棒です。モデルにない項が灰色の棒です。プロットでは、2つの主効果は有意水準α = 0.05において統計的に有意です。2次項と交互作用効果も有意です。交互作用と2次項の一部である主効果は、これらの効果が統計的に有意でないにもかかわらず、モデルにあります。

また、Aは最も長く伸びているため、これが最大の効果を持つこともわかります。EEの2次項の効果は、図で最も小さな効果です。

ステップ2:応答に対して統計的に有意な効果を持つ項を特定する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項の係数は0に等しく、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意です
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではありません
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。
係数が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
因子
因子の係数が統計的に有意な場合、因子の係数は0ではないと結論付けることができます。
因子間の交互作用
交互作用の係数が統計的に有意な場合は、因子と応答の間の関係がその項の他の因子に依存すると結論付けることができます。
2次項
2次項の係数が統計的に有意な場合、応答曲面に曲線が含まれると結論付けることができます。
共変量
共変量の係数が統計的に有意な場合、応答と共変量の関連性は統計的に有意であると結論付けることができます。
ブロック
ブロックの係数が統計的に有意な場合は、ブロックに含まれる応答の平均値は応答の全体平均と異なると結論付けることができます。
2次項と交互作用項の分散拡大要因の値は1ではなく、多重共線性があることを示しています。詳細については、決定的スクリーニング計画の分析の係数表を参照し、VIFをクリックします。

コード化係数

係数係数の標準誤差t値p値VIF
定数617.115.041.160.000 
練習52.416.538.020.0001.00
破裂8.626.531.320.2201.00
静穏性-39.596.53-6.060.0001.00
中心-2.366.53-0.360.7271.00
掃除2.846.530.440.6741.00
掃除*掃除49.416.72.950.0161.16
破裂*中心24.637.593.250.0101.16
主要な結果:p値、係数

この結果では、習得と静音の主効果は、水準0.05のときに統計的に有意になります。この結果から、これらの変数の変化は応答変数の変化に関連付けられていると結論付けることができます。

掃引の主効果は統計的に有意ではありませんが、2次効果は有意です。この結果から、これらの変数の変化は応答変数の変化に関連付けられているものの、その関係は線形ではないと結論付けることができます。

破裂と中心の主効果は統計的に有意ではありませんが、交互作用効果は有意です。この結果から、これらの変数の変化は応答変数の変化に関連付けられているものの、その効果は他の因子によって変わると結論付けることができます。

ステップ3:データに対するモデルの適合度を判断する

データに対するモデルの適合度を判断するために、モデル要約表の適合度統計量を調査します。

S

Sを使い、モデルがどの程度良好に応答を表示するか判断します。

Sは応答変数の単位で測定され、データ値と適合値の間の距離を表します。Sの値が小さければ小さいほど、モデルによる応答の記述が良好になります。ただし、Sの値が小さいだけでは、そのモデルが仮定を満たしているとは言い切れません。残差プロットを確認して仮定を検証する必要があります。

R二乗

R2値が大きくなるほど、モデルのデータへの適合度は上がります。R2は常に0~100%の間の値になります。

R2はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。

R二乗(調整済み)

異なる数の予測変数を持つモデルを比較する場合は、調整済みR2を使用します。R2はモデルに予測変数を追加すると、それがモデルを改善しないとしても必ず大きくなります。調整済みR2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

R二乗(予測)

予測R2を使用して、モデルが新しい観測値に対する応答をどの程度良好に予測するかを判断します。予測R2値が大きいモデルの予測能力は優れています。

R2よりも大幅に低い予測R2は、モデルの過剰適合を示している可能性があります。過剰適合は、母集団には重要でない項を追加した場合に起こります。そのモデルはサンプルデータに即してしまい、母集団の予測に適さなくなる可能性があります。

予測R2は、モデル計算に含まれていない観測値によって計算されるため、モデルを比較する場合は調整済みR2より便利です。

AICcとBIC
ステップワイズ法の各ステップの詳細を表示するとき、または分析結果を拡大表示するとき、さらに2つの統計量が表示されます。これらの統計量は補正赤池情報量基準(AICc)およびベイズ情報量規準(BIC)です。異なるモデルを比較する際はこれらの統計量を使用します。どちらの統計量でも、小さい値が好ましいと考えられます。
適合度統計量を解釈するとき、以下の点を考慮してください。
  • サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。たとえば、より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。
  • 適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルに望ましい値がある場合でも、残差プロットを確認してモデルが仮定を満たしているか検証する必要があります。

モデル要約

SR二乗R二乗 (調整済み)R二乗 (予測)
24.448293.68%88.77%76.78%
主要な結果:S、R二乗、R二乗(調整済み)、R二乗(予測)

この結果でモデルは、93.68%の変動を説明しています。これらのデータで、R2値はモデルが良好にデータに適合していることを示しています。新しいモデルが別の項と適合する場合は、調整済みR2値と予測R2値を使ってモデルの適合度を比較してください。

ステップ4:モデルが分析の仮説を満たすかどうか判断する

残差プロットを使用して、モデルが適切か、分析の仮定が満たされているかどうかを判断しやすくします。仮定を満たさない場合、そのモデルはデータにあまり適合しない可能性があり、結果の解釈は慎重に行う必要があります。

残差プロットのパターンを処理する方法の詳細は決定的スクリーニング計画の分析の残差プロットを参照し、ページ上部にある一覧の中から残差プロット名をクリックしてください。

残差対適合値プロット

以下の表にあるパターンは、このモデルが、モデルの仮説を満たさないことを示している可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値
ある点が他の点からX軸方向に遠く離れている 影響力のある点

残差対適合値プロットを使用して、残差はランダムに分布し、均一な分散が存在するという仮定を検証します。点に特徴的なパターンが無く、0の両側にランダムに来るのが理想的です。

残差対順序プロット

残差対データ順序プロットを使用して、残差が互いから独立しているという仮定を検証します。独立している残差は、時間順で表示した場合にトレンドやパターンを示しません。点にパターンがある場合、互いに近い残差は相関している可能性があり、独立していないことを示しています。プロットの残差が中心線の周りにランダムに来るのが理想的です。
パターンがある場合は原因を調査します。パターンが次のタイプである場合、残差が従属している可能性を示しています。
トレンド
シフト
周期

残差の正規確率プロット

残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。

以下の表にあるパターンは、このモデルが、モデルの仮説を満たさないことを示している可能性があります。

パターン パターンが示す意味
直線ではない 非正規性
直線から離れた点 外れ値
傾きが変化する 未確認の変数