効果のパレート図を使用すると、項の相対的重要度および統計的有意性を比較することができます。モデルに誤差自由度があると、図が表示されます。
Minitabでは、項をその絶対値の降順でプロットします。パレート図上の参照ラインは、項の有意性を示します。デフォルトでは、有意水準0.05で参照ラインが引かれます。
項 | 係数 | 係数の標準誤差 | t値 | p値 | VIF |
---|---|---|---|---|---|
定数 | -0.756 | 0.736 | -1.03 | 0.314 | |
濃度 | 0.1545 | 0.0633 | 2.44 | 0.022 | 1.03 |
触媒比 | 0.2171 | 0.0316 | 6.86 | 0.000 | 1.02 |
硬化温度 | 0.01081 | 0.00462 | 2.34 | 0.027 | 1.04 |
硬化時間 | 0.0946 | 0.0546 | 1.73 | 0.094 | 1.00 |
予測変数であるホルムアルデヒド濃度、触媒比、温度には有意水準0.05未満のp値があります。この結果から、これらの予測変数が統計的に有意な防皺性と関連性があることがわかります。例えばホルムアルデヒド濃度の係数については、モデル内の他項が一定の状態でも、濃度が1単位上昇するごとに、防しわ性の平均値が0.1545単位で増加すると考えられます。
時間のp値は0.05より大きく、時間が応答に関連していると結論付けるに十分な証拠はないことがわかります。化学者は、この予測変数なしでモデルを再適合させたいと思うかもしれません。
データに対するモデルの適合度を判断するために、モデル要約表の適合度統計量を調査します。
Sを使い、モデルがどの程度良好に応答を表示するか判断します。R2統計量のかわりにSを使い、定数を持たないモデルの適合を比較します。
Sは応答変数の単位で測定され、データ値と適合値の間の距離を表します。Sの値が小さければ小さいほど、モデルによる応答の記述が良好になります。ただし、Sの値が小さいだけでは、そのモデルが仮定を満たしているとは言い切れません。残差プロットを確認して仮定を検証する必要があります。
R2値が大きくなるほど、モデルのデータへの適合度は上がります。R2は常に0~100%の間の値になります。
R2はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。
異なる数の予測変数を持つモデルを比較する場合は、調整済みR2を使用します。R2はモデルに予測変数を追加すると、それがモデルを改善しないとしても必ず大きくなります。調整済みR2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。
予測R2を使用して、モデルが新しい観測値に対する応答をどの程度良好に予測するかを判断します。予測R2値が大きいモデルの予測能力は優れています。
R2よりも大幅に低い予測R2は、モデルの過剰適合を示している可能性があります。過剰適合は、母集団には重要でない項を追加した場合に起こります。そのモデルはサンプルデータに即してしまい、母集団の予測に適さなくなる可能性があります。
予測R2は、モデル計算に含まれていない観測値によって計算されるため、モデルを比較する場合は調整済みR2より便利です。
サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。たとえば、より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。
適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルに望ましい値がある場合でも、残差プロットを確認してモデルが仮定を満たしているかを検証する必要があります。
S | R二乗 | R二乗 (調整済み) | R二乗 (予測) |
---|---|---|---|
0.811840 | 72.92% | 68.90% | 62.81% |
この結果から、応答変動のおよそ73%をモデルで説明できます。このデータの場合、R2の値はモデルがデータに十分に適合することを示しています。異なる予測変数を追加モデルに適合させる場合、調整済みR2値と予測R2の値を使って、追加モデルがどの程度データに適合するかを比較します。
残差プロットを使用して、モデルが適切か、分析の仮定が満たされているかどうかを判断しやすくします。仮定を満たさない場合、そのモデルはデータにあまり適合しない可能性があり、結果の解釈は慎重に行う必要があります。
残差プロットのパターンを処理する方法の詳細は回帰モデルの適合と 線形回帰の 残差プロットを参照し、ページ上部にある一覧の中から残差プロット名をクリックしてください。
残差対適合値プロットを使用して、残差はランダムに分布し、均一な分散が存在するという仮定を検証します。点に特徴的なパターンがなく、0の両側にランダムにくるのが理想的です。
パターン | パターンが示す意味 |
---|---|
残差が適合値周辺に扇状または不均等に分散している | 不均一分散 |
曲線 | 高次の項の欠損 |
ゼロから遠い点 | 外れ値 |
ある点が他の点からX軸方向に遠く離れている | 影響力のある点 |
残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。
パターン | パターンが示す意味 |
---|---|
直線ではない | 非正規性 |
直線から離れた点 | 外れ値 |
変化する傾き | 未確認の変数 |