回帰モデルの適合の例

ある化学研究者が、いくつかの予測変数が綿布のしわになりにくさにどのように関係するかを理解したいと考えています。化学者は、異なる処理時間、処理温度、ホルムアルデヒド濃度、触媒比の設定で製造された32個の綿セルロースを調査します。各綿布について、しわになりにくさの指標である防皺度を記録します。

化学者は、複数回の回帰分析を実行して予測変数を使用したモデルを適合し、応答に対して統計的に有意な関係を持たない予測変数を除外します。

  1. 標本データを開く、防皺性.MTW.
  2. 統計 > 回帰 > 回帰 > 回帰モデルの適合を選択します。
  3. 応答評点を入力します。
  4. 連続予測変数に、濃度触媒比硬化温度硬化時間を入力します。
  5. グラフをクリックします。
  6. 効果プロットパレート図を選択します。
  7. 残差プロット一覧表示を選択します。
  8. 残差対変数に、濃度触媒比硬化温度硬化時間を入力します。
  9. 各ダイアログボックスでOKをクリックします。

結果を解釈する

予測変数温度、触媒比、ホルムアルデヒド濃度には、0.05の有意水準よりも小さいp値があります。これらの結果により、これらの予測変数は防しわ性に対して統計的に有意な効果を持つことが示されます。時間のp値は0.05より大きく、時間が応答に関連していると結論付けるに十分な証拠はないことがわかります。化学者は、この予測変数なしでモデルを再適合させたいと思うかもしれません。

パレート図で、温度、触媒比、ホルムアルデヒド濃度の効果は有意水準0.05において統計的に有意であることが示されています。触媒比が最も長く伸びているため、最大の効果は触媒比となります。時間の効果の伸びは最も短いため、時間の効果は最小です。

残差プロットで、モデルに問題がある可能性が示されています。
  • 残差対適合値プロット上の点は、ゼロの周囲にランダムに分布していないようです。データ内の異なるグループを表す点群分布が見られるようです。化学者はそのグループを調査し、原因を特定する必要があります。
  • 残差プロット対比は曲率を示し、触媒比としわに曲線関係があることがわかります。化学者は、モデルに比の2次項の追加を検討する必要があります。

回帰式

評点=-0.756 + 0.1545 濃度 + 0.2171 触媒比 + 0.01081 硬化温度 + 0.0946 硬化時間

係数

係数係数の標準誤差t値p値VIF
定数-0.7560.736-1.030.314 
濃度0.15450.06332.440.0221.03
触媒比0.21710.03166.860.0001.02
硬化温度0.010810.004622.340.0271.04
硬化時間0.09460.05461.730.0941.00

モデル要約

SR二乗R二乗 (調整済み)R二乗 (予測)
0.81184072.92%68.90%62.81%

分散分析

要因自由度調整平方和調整平均平方F値p値
回帰447.909611.977418.170.000
  濃度13.92323.92325.950.022
  触媒比131.021631.021647.070.000
  硬化温度13.60313.60315.470.027
  硬化時間11.98391.98393.010.094
誤差2717.79530.6591   
  不適合2517.78360.7113121.940.008
  純誤差20.01170.0058   
合計3165.7049     

異常な観測値の適合値と診断

観測値評点適合値残差標準化残差
94.8003.1781.6222.06R
R  大きな残差