非線形回帰の主要な結果を解釈する

非線形回帰モデルを解釈するには、次の手順を実行します。主要な出力結果は、適合線プロット、回帰の標準誤差、残差プロットを示しています。

ステップ1:回帰線がデータに適合するかどうか判断する

非線形モデルに1つの予測変数がある場合、Minitabは適合線プロットで予測変数と応答の関係を表示します。このプロットには、回帰式を表す回帰線が含まれます。プロット上の95%の信頼区間と予測区間を表示することを選択することもできます。

モデルの適合度と目的に合致するかどうかを評価します。適合線プロットを調べ、以下の基準を満たしているかを判断します。
  • 全予測値の範囲全体を通して、サンプルには十分な数の観測値が含まれています。
  • モデルがデータの曲面性に適切に適合する。どちらのモデルが最適かを判断するには、プロット、回帰の標準誤差(S)を調べ、データに反復が含まれている場合は不適合検定での調査を行います。
  • 結果に大きな影響を与える可能性のある外れ値がないか探します。外れ値がある場合は、その原因を特定してください。データ入力や測定の誤差を修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。外れ値の検出に関する詳細は、異常な観測値を参照してください。
この適合線プロットでは、回帰線は曲線の非常に近くに沿っています。適合線からは系統的な偏差は見受けられません。点は予測値の範囲全体を適切にカバーしています。

ステップ2: 予測変数と応答の関係を調べる

回帰式を使用して、モデルにおける応答と項の関係を表します。回帰式は回帰線の代数で表現されます。各予測変数の値を式に当てはめ、平均応答値を計算します。線形回帰とは異なり、非線形回帰式はさまざまな形式を取ります。

非線形式の場合、各予測変数が応答に及ぼす影響を判断するということは、線形式の場合ほど直観的ではありません。線形モデルのパラメータ推定値とは違い、非線形モデルにおけるパラメータ推定値に対する決まった解釈はありません。各パラメータの正しい解釈は、予想関数とその中のパラメータの位置によって決まります。非線形モデルに1つしか予測変数がない場合は、適合線プロットを評価して予測変数と応答の関係を確認します。

パラメータ推定値が統計的に有意であるかを判断する必要がある場合は、パラメータの信頼区間を使用します。範囲が帰無仮説を含まない場合は、パラメータ値は統計的に有意です。Minitabでは、非線形回帰のパラメータのp値を計算できません。線形回帰の場合、すべてのパラメータの帰無仮説値は0で、効果なしの場合、さらに、p値はこの値に基づきます。ただし、非線形回帰の場合、各パラメータの正しい帰無仮説値は、予想関数とその中のパラメータの位置によって決まります。

データセット、予想関数、および信頼水準によっては、どちらかまたは両方の信頼限界がない可能性があります。Minitabでは、欠損結果にはアスタリスク(*)を付けてセッションウィンドウに表示します。信頼区間に欠損限界がある場合、信頼水準の低い方が両側信頼区間を生成します。

解による収束によってモデル適合の最適性や平方和誤差(SSE)の最小化が保証されるわけではありません。平方和誤差(SSE)最小が全体ではなく一部である場合や、または予測関数が不正確なためにパラメータ値が不適切になり、その不適切なパラメータ値が原因で収束している場合もあるからです。そのため、パラメータ値、適合線プロットおよび残差プロットを調べて、モデルが適合しているか、パラメータ値が妥当であるかを判断することが極めて重要です。

膨張 = (1.07764 - 0.122693 * 絶対温度 + 0.00408638 * 絶対温度 ** 2 - 1.42627E-06 * 絶対温度 ** 3) / (1 -
     0.00576099 * 絶対温度 + 0.000240537 * 絶対温度 ** 2 - 1.23144E-07 * 絶対温度 ** 3)
主要な結果: 式

この結果には、1つの予測変数と7つのパラメータ推定値があります。応答変数は膨張で、予測変数は絶対温度です。長い式で応答と予測との間の関係を記述します。絶対温度が1度上昇したときの銅の膨張に対する影響は、開始温度によって大きく異なります。温度の変更が銅の膨張に及ぼす効果は、簡単には要約できません。適合線プロットを評価し、予測変数と応答の関係を確認します。

式に温度の値を入力すると、結果は銅の膨張の適合値となります。

ステップ3: データに対するモデルの適合度を判断する

どの程度モデルがデータに適合するかを判断するには、モデル要約表の統計量と不適合表を調べます。

S

Sを使い、モデルがどの程度良好に応答を表示するか判断します。

Sは応答変数の単位で測定され、データ値と適合値の間の距離を表します。Sの値が小さければ小さいほど、モデルによる応答の記述が良好になります。ただし、Sの値が小さいだけでは、そのモデルが仮定を満たしているとは言い切れません。残差プロットを確認して仮定を検証する必要があります。

不適合

Minitabは、データに反復が含まれている場合、不適合表を自動的に表示します。反復は、同じ予測値を持つ複数の観測値です。データに反復が含まれていなければ、この検定の実行に必要な純粋誤差を計算することはできません。反復に対するさまざまな応答値は、純粋誤差を表します。これは、ランダム変動だけが複数の応答観測値の差を引き起こすためです。

モデルによって応答と予測の関係が正しく指定されるかどうかを判断するには、不適合度検定のp値と有意水準を比較して帰無仮説を評価します。不適合度検定の帰無仮説は、モデルによって応答と予測の関係が正しく指定されるという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際にはモデルによって応答と予測の関係が正しく指定されるのにも関わらず、正しく指定されないと結論付ける可能性が5%であることを示しています。
p値 ≤ α:その不適合は統計的に有意です
p値が有意水準以下の場合は、そのモデルでは関係が正しく指定されないと結論付けます。モデルを改善するには、項を追加するか、またはデータを変換する必要があります。
p値 > α:その不適合は統計的に有意ではありません

p値が有意水準より大きい場合は、検定で不適合が何も検出されません。

不適合

要因自由度平方和平均平方F値p値
誤差2291.532440.0066919   
  不適合2281.525830.00669221.010.679
  純誤差10.006610.0066125   

要約

反復15
誤差の最終平方和1.53244
誤差の自由度229
平均平方誤差0.0066919
S0.0818039
* 警告 * 一部のパラメータ推定値に高い相関があります。予想関数を簡略化するか、予測変数またはパラメータを変換して共線性を小さくしてください。
主要な結果: S、不適合度

これらの結果によれば、Sは、データ値と適合値の距離の標準偏差はおよそ0.08の単位であることを示しています。不適合検定のp値は0.679であり、データの適合度が低い根拠にはなりません。

ステップ4:モデルが分析の仮説を満たすかどうか判断する

残差プロットを使用して、モデルが適切か、分析の仮定が満たされているかどうかを判断しやすくします。仮定を満たさない場合、そのモデルはデータにあまり適合しない可能性があり、結果の解釈は慎重に行う必要があります。

残差プロットのパターンを処理する方法の詳細は非線形回帰の残差プロットを参照し、ページ上部にある一覧の中から残差プロット名をクリックしてください。

残差対適合値プロット

残差対適合値プロットを使用して、残差はランダムに分布し、均一な分散が存在するという仮定を検証します。点に特徴的なパターンがなく、0の両側にランダムにくるのが理想的です。

以下の表にあるパターンは、このモデルが、モデルの仮説を満たさないことを示している可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値
ある点が他の点からX軸方向に遠く離れている 影響力のある点
この残差対適合値プロット上の点は、データ=ゼロの周囲にランダムに分布しているように見えます。残差の値が適合値によって変わる根拠はありません。

残差対順序プロット

残差対データ順序プロットを使用して、残差が互いから独立しているという仮定を検証します。独立している残差は、時間順で表示した場合にトレンドやパターンを示しません。点にパターンがある場合、互いに近い残差は相関している可能性があり、独立していないことを示しています。プロットの残差が中心線の周りにランダムに来るのが理想的です。
パターンがある場合は原因を調査します。パターンが次のタイプである場合、残差が従属している可能性を示しています。
トレンド
シフト
周期
この残差対順序プロットでは、残差は中心線の周りにランダムに配置されているように見えます。残差が独立していないという証拠は存在しません。

残差の正規確率プロット

残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。

以下の表にあるパターンは、このモデルが、モデルの仮説を満たさないことを示している可能性があります。
パターン パターンが示す意味
直線ではない 非正規性
直線から離れた点 外れ値
変化する傾き 未確認の変数
この正規確率プロットでは、点がほぼ直線に沿っています。非正規性、外れ値、未確認の変数の証拠は存在しません。