適合線プロットの主要な結果を解釈する

適合線プロットを解釈するには、次の手順を実行します。主要な結果にはp値、適合線プロット、R2、残差プロットが含まれます。

ステップ1:モデルにおける応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項の係数は0に等しく、項と応答に関連性がないという仮定です。通常、0.05の有意水準(αまたはアルファとも呼ばれる)が有効に機能します。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。2次モデルまたは3次モデルを適合して、2次または3次の項が有意な場合、データに曲面性が含まれると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない

p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。2次モデルまたは3次モデルを適合して、2次または3次の項が統計的に有意でない場合、別のモデルを選んでみてください。

分散分析

要因自由度平方和平均平方F値p値
回帰212189.46094.70106.540.000
誤差261487.357.21   
合計2813676.7     

逐次分散分析

要因自由度平方和F値p値
線形111552.8146.860.000
2次1636.611.130.003
主要な結果: p値

これらの結果では、線形項のp値は密度が0.000であり、2次項の場合、密度2は0.003です。どちらの値も、有意水準α=0.05より小さいです。これらの結果では、剛性と密度の関連性は統計的に有意であることを示しています。

ステップ2:回帰線がデータに適合するかどうか判断する

モデルの適合度と目的に合致するかどうかを評価します。適合線プロットを調べ、以下の基準を満たしているかを判断します。
  • 全予測値の範囲全体を通して、サンプルには十分な数の観測値が含まれています。
  • モデルがデータの曲面性に適切に適合する。線形モデルを適合してデータに曲面性を見つけた場合、分析を繰り返して2次または3次モデルを選択します。どちらのモデルが最適かを判断するには、プロットと適合度統計量を調べてください。モデル内の項のp値を確認し、それらが統計的に有意であることを確かめ、知識を基に実質的な有意性を評価してください。
  • 結果に大きな影響を与える可能性のある外れ値がないか探します。外れ値がある場合は、その原因を特定してください。データ入力や測定の誤差はすべて修正します。異常な1回きりの事象(特殊原因)に関連付けられたデータ値は除外することを検討します。その後で、分析を繰り返します。外れ値の検出に関する詳細は、異常な観測値を参照してください。
この適合線プロット上で、データ点は一般的には回帰線になります。データ点は十分に、密度の値の範囲全体を対象とします。しかし、グラフの右上隅のデータ点は外れ値に見えます。このデータ点を調査して原因を特定します。

ステップ3:項と応答の関連度を調べる

項のp値が有意な場合、回帰式と係数を調べて、項がどの程度応答と関連性があるかを理解します。

回帰式を使用して、モデルにおける応答と項の関係を表します。回帰式は回帰線の代数で表現されます。線形モデルの回帰式は次の形式を取ります。Y = b0 + b1x1回帰式では、Yが応答変数、b0が定数または切片、b1が線形項の推定係数(線の傾き)、x1が項の値を表します。

項の係数は、その項の1単位分の変化に対する平均応答の変化を表します。係数の符号は項と応答の関係の方向を示します。項が増えるにつれて係数が負値になる場合は、平均応答値は減少します。項が増えるにつれて係数が正値になる場合は、平均応答値は増加します。

例えば、あるマネージャーは従業員のスキルテストのスコアが回帰モデル y = 130 + 4.3x によって予測できると判断しました。この式でxは社内トレーニングの時間(0から20)、yはテストスコアです。係数、または傾きは4.3で、これはトレーニング1時間ごとにテストのスコアが4.3ポイントずつ上がることを示しています。

係数に関する詳細は回帰係数を参照してください。

回帰式
剛性 = 12.70 - 1.517 密度 + 0.1622 密度^2

モデル要約

SR二乗R二乗 (調整済み)
7.5634289.13%88.29%
主要な結果: 回帰式、係数

予測変数の密度係数は-1.517で、密度2の係数は0.1622です。したがって、二次関係では、パーティクルボードの平均剛性は、密度値が小さい場合よりも密度値が大きいほど急速に増加します。

ステップ4:データに対するモデルの適合度を判断する

データに対するモデルの適合度を判断するために、モデル要約表の適合度統計量を調査します。

R二乗

R2は、モデルで説明される応答の変動のパーセントです。R2値が大きくなるほど、モデルのデータへの適合度は上がります。R2は常に0~100%の間の値になります。

R2はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。

R二乗(調整済み)

異なる数の予測変数を持つモデルを比較する場合は、調整済みR2を使用します。R2はモデルに予測変数を追加すると、それがモデルを改善しないとしても必ず大きくなります。調整済みR2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

R2の値を比較するとき、以下の点を考慮してください。
  • サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。たとえば、より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。

  • 適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルに望ましい値がある場合でも、残差プロットを確認してモデルが仮定を満たしているかを検証する必要があります。

回帰式
剛性 = 12.70 - 1.517 密度 + 0.1622 密度^2

モデル要約

SR二乗R二乗 (調整済み)
7.5634289.13%88.29%
主要な結果:R二乗

これらの結果では、パーティクルボードの密度は、ボードの剛性に関する変動の84.5%を説明します。R2の値は、モデルがデータに適合することを示しています。

ステップ5:モデルが分析の仮定を満たすかどうか判断する

残差プロットを使用して、モデルが適切か、分析の仮定が満たされているかどうかを判断しやすくします。仮定を満たさない場合、そのモデルはデータにあまり適合しない可能性があり、結果の解釈は慎重に行う必要があります。

残差対適合値プロット

残差対適合値プロットを使用して、残差はランダムに分布し、均一な分散が存在するという仮定を検証します。点に特徴的なパターンがなく、0の両側にランダムにくるのが理想的です。

次の表のパターンは、モデルがモデルの前提を満たしていないことを示している可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値
ある点が他の点からX軸方向に遠く離れている 影響力のある点
この残差対適合値プロットには、データ点はランダムに配置されています。しかし、グラフの右上隅のデータ点は外れ値に見えます。外れ値の原因を識別する必要があります。データ入力や測定の誤差はすべて修正します。異常な1回きりの事象(特殊原因)に関連付けられたデータ値は除外することを検討します。その後で、分析を繰り返します。

残差対順序プロット

残差対データ順序プロットを使用して、残差が互いから独立しているという仮定を検証します。独立している残差は、時間順で表示した場合にトレンドやパターンを示しません。点にパターンがある場合、互いに近い残差は相関している可能性があり、独立していないことを示しています。プロットの残差が中心線の周りにランダムにくるのが理想的です。
パターンがある場合は原因を調査します。パターンが次のタイプである場合、残差が従属している可能性を示しています。
トレンド
Shift
周期
この残差対順序プロットでは、点は中心線の周りにランダムに配置されているように見えます。ワークシートの行 15、21、および 23 の観測値に対応するポイントの残差は大きくなります。

正規確率プロット

残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。

次の表のパターンは、モデルがモデルの前提を満たしていないことを示している可能性があります。
パターン パターンが示す意味
直線ではない 非正規性
直線から遠い点 外れ値
傾きが変化する 未確認の変数
この正規確率プロットでは、残差は直線からわずかに逸脱します。ただし、データに少なくとも 15 ポイントが含まれている場合、通常、信頼性の高い p 値の計算では正規性は問題ありません。

残差プロットのパターンを処理する方法の詳細は、適合線プロットの残差プロットを参照してください。