非線形回帰の回帰式とパラメータ推定値

回帰式、およびパラメータ推定値表のすべての統計量の定義と解釈について解説します。

回帰式を使用して、モデルにおける応答と項の関係を表します。回帰式は回帰線の代数で表現されます。各予測変数の値を式に当てはめ、平均応答値を計算します。線形回帰とは異なり、非線形回帰式はさまざまな形式を取ります。

非線形式の場合、各予測変数が応答に及ぼす影響を判断するということは、線形式の場合ほど直観的ではありません。線形モデルのパラメータ推定値とは違い、非線形モデルにおけるパラメータ推定値に対する決まった解釈はありません。各パラメータの正しい解釈は、予想関数とその中のパラメータの位置によって決まります。非線形モデルに1つしか予測変数がない場合は、適合線プロットを評価して予測変数と応答の関係を確認します。

解による収束によってモデル適合の最適性や平方和誤差(SSE)の最小化が保証されるわけではありません。平方和誤差(SSE)最小が全体ではなく一部である場合や、または予測関数が不正確なためにパラメータ値が不適切になり、その不適切なパラメータ値が原因で収束している場合もあるからです。そのため、パラメータ値、適合線プロットおよび残差プロットを調べて、モデルが適合しているか、パラメータ値が妥当であるかを判断することが極めて重要です。

解釈

この結果には、1つの予測変数と7つのパラメータ推定値があります。応答変数は膨張で、予測変数は絶対温度です。長い式で応答と予測との間の関係を記述します。絶対温度が1度上昇したときの銅の膨張に対する影響は、開始温度によって大きく異なります。温度の変更が銅の膨張に及ぼす効果は、簡単には要約できません。適合線プロットを評価し、予測変数と応答の関係を確認します。

式に温度の値を入力すると、結果は銅の膨張の適合値となります。

膨張 = (1.07764 - 0.122693 * 絶対温度 + 0.00408638 * 絶対温度 ** 2 - 1.42627E-06 * 絶対温度 ** 3) / (1 -
     0.00576099 * 絶対温度 + 0.000240537 * 絶対温度 ** 2 - 1.23144E-07 * 絶対温度 ** 3)

推定

アルゴリズムがパラメータ値に適切に収束される場合、パラメータ推定値は平方和誤差(SSE)を最小化します。

解による収束によってモデル適合の最適性や平方和誤差(SSE)の最小化が保証されるわけではありません。平方和誤差(SSE)最小が全体ではなく一部である場合や、または予測関数が不正確なためにパラメータ値が不適切になり、その不適切なパラメータ値が原因で収束している場合もあるからです。そのため、パラメータ値、適合線プロットおよび残差プロットを調べて、モデルが適合しているか、パラメータ値が妥当であるかを判断することが極めて重要です。

解釈

非線形式の場合、各予測変数が応答に及ぼす影響を判断するということは、線形式の場合ほど直観的ではありません。線形モデルのパラメータ推定値とは違い、非線形モデルにおけるパラメータ推定値に対する決まった解釈はありません。各パラメータの正しい解釈は、予想関数とその中のパラメータの位置によって決まります。非線形モデルに1つしか予測変数がない場合は、適合線プロットを評価して予測変数と応答の関係を確認します。

この結果には、1つの予測変数と7つのパラメータ推定値があります。応答変数は膨張で、予測変数は絶対温度です。長い式で応答と予測との間の関係を記述します。絶対温度が1度上昇したときの銅の膨張に対する影響は、開始温度によって大きく異なります。温度の変更が銅の膨張に及ぼす効果は、簡単には要約できません。適合線プロットを評価し、予測変数と応答の関係を確認します。

パラメータ推定値

パラメータ推定推定値の標準誤差95%信頼区間
b11.077640.170702(0.744913, 1.42486)
b2-0.122690.012000(-0.147378, -0.09951)
b30.004090.000225(0.003655, 0.00455)
b4-0.000000.000000(-0.000002, -0.00000)
b5-0.005760.000247(-0.006246, -0.00527)
b60.000240.000010(0.000221, 0.00026)
b7-0.000000.000000(-0.000000, -0.00000)
膨張 = (b1 + b2 * 絶対温度 + b3 * 絶対温度 ** 2 + b4 * 絶対温度 ** 3) / (1 + b5 * 絶対温度 + b6 * 絶対温度 ** 2 +
     b7 * 絶対温度 ** 3)

推定値の標準誤差

推定値の標準誤差により、同じ母集団から繰り返しサンプルを抽出する場合に得られるパラメータ推定値間の変動を推定します。

解釈

推定値の標準誤差を使用して、パラメータ推定値の精度を測定します。標準誤差が小さいほど、推定値の精度が高くなります。

95%の信頼区間(CI)

信頼区間(CI)は、モデル内の各パラメータの係数の真の値が含まれている可能性のある値の範囲です。

データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、ランダムなサンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
この単一値は、サンプルデータを使用して母数を推定するためのものです。信頼区間は、点推定を中心にして得られます。
誤差幅
誤差幅は、信頼区間の幅を定義し、サンプル、サンプルサイズ、信頼水準において観測された変動性によって決定します。信頼区間の上限を計算するには、誤差幅を点推定に加算します。信頼区間の下限を計算するには、点推定から誤差幅を減算します。

解釈

信頼区間を使用して、各パラメータの推定値を評価します。

たとえば、信頼水準が95%の場合、信頼区間に母集団のパラメータ値が含まれていることが95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルサイズを増加させることを検討します。

パラメータ推定値が統計的に有意であるかを判断する必要がある場合は、パラメータの信頼区間を使用します。範囲が帰無仮説を含まない場合は、パラメータ値は統計的に有意です。Minitabでは、非線形回帰のパラメータのp値を計算できません。線形回帰の場合、すべてのパラメータの帰無仮説値は0で、効果なしの場合、さらに、p値はこの値に基づきます。ただし、非線形回帰の場合、各パラメータの正しい帰無仮説値は、予想関数とその中のパラメータの位置によって決まります。

データセット、予想関数、および信頼水準によっては、どちらかまたは両方の信頼限界がない可能性があります。Minitabでは、欠損結果にはアスタリスク(*)を付けてセッションウィンドウに表示します。信頼区間に欠損限界がある場合、信頼水準の低い方が両側信頼区間を生成します。

パラメータ推定値の相関行列

行列はパラメータ推定の相関を表示します。パラメータ推定値の相関性が高い場合は、パラメータの数を減らしてモデルを簡略化することを検討します。