タグチ計画の分析のモデル要約表

モデル要約表のすべての統計量の定義と解釈について解説します。

S

Sはデータ値と適合値間の距離の標準偏差を表します。Sは応答変数の単位で測定されます。

解釈

Sを使い、モデルがどの程度良好に応答Sは応答変数の単位で測定され、データ値と適合値がどの程度離れているかを示す標準偏差を表しています。Sの値が小さければ小さいほど、モデルによる応答の記述が良好になります。しかし、Sの値が小さいことだけで、そのモデルが仮定を満たしているとはいえません。残差プロットを確認し、仮定を検証する必要があります。

たとえば、ポテトチップ製造会社が、パッケージあたりに含まれる砕けたポテトチップの割合に影響する因子を調べるとします。モデルを有意な予測変数まで下げ、Sの計算値が1.79になったとします。この結果から、適合値を中心としたデータ点の標準偏差が1.79であることが分かります。モデルを比較する場合、1.79よりも低い値は良好な適合を示し、高い値は適合度が低いことを示しています。

R二乗

R2は、モデルで説明される応答の変動のパーセントです。値は1から残差平方和(モデルによって説明されない変動)の比を引いて全体平方和(データの変動の合計)まで計算されます。

解釈

次の適合線プロットは異なるR2値を表しています。最初のプロットは、応答における85.5%の変動を説明する単回帰モデルを図示しています。2つ目のプロットは、応答における22.6%の変動を説明するモデルを図示しています。モデルによって説明される変動が大きいほど、適合回帰直線の近くにデータ点がプロットされます。理論的には、モデルによって変動の100%を説明できる場合、適合値は必ず観測値と等しくなり、すべてのデータ点が適合回帰線上にプロットされます。しかし、R2値が100%であったとしても、モデルが必ずしも新しい観測値をうまく予測するとは限りません。
R2値を解釈する際は次の問題を考慮してください。
  • R2はモデルに予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。
  • サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。
  • R2は、データに対するモデルの適合度を測る1つの測度にすぎません。モデルのR2が大きくても残差プロットを確認してモデルが仮定を満たしているか検証する必要があります。

R二乗(調整済み)

調整済みR2はモデルで説明される応答の変動のパーセントで、観測値数と比較してモデル内の予測変数の数に応じて調整されます。調整されたR2は1から平均平方誤差(MSE)の比を引いて全体平均平方(MS Total)まで計算されます。

解釈

異なる数の予測変数を持つモデルを比較する場合は、調整済みR2を使用します。R2はモデルに予測変数を追加すると、それがモデルを改善しないとしても必ず大きくなります。調整済みR2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

たとえば、ポテトチップ製造会社が、パッケージあたりに含まれる砕けたポテトチップの割合に影響する因子を調べるとします。前方ステップワイズによる方法で予測変数を追加したところ、以下の結果が得られたとします。
モデル ポテトの割合 冷却率 調理温度 R2 調整済みR2
1 X     52% 51%
2 X X   63% 62%
3 X X X 65% 62%

1つ目のモデルのR2は50%以上になります。2つ目のモデルでは冷却率がモデルに追加されました。調整済みR2は大きくなり、冷却率によりモデルが改善されることを示しています。調理温度が追加された3つ目のモデルでもR2は大きくなりますが、調整済みR2は大きくなりません。3番目のステップでは、調理温度がモデルに追加され、逸脱度R2は上昇しますが、調整済みR2は上昇しません。これらの結果から、調理温度はモデルを改善しないことがわかります。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください