予測のすべての統計量

回帰式

回帰式を使用して、モデルにおける応答と項の関係を表します。回帰式は回帰線の代数で表現されます。線形モデルの回帰式は次の形式を取ります:Y= b0 + b1x1。回帰式では、Yが応答変数、b0が定数または切片、b1が線形項の推定係数(線の傾き)、x1が項の値を表します。

2つ以上の項を持つ回帰式は、次の形式を取ります。

y = b0 + b1X1 + b2X2 + ... + bkXk

回帰式では、各文字は以下を表します。
  • yは応答変数
  • b0は定数です
  • b1, b2, ..., bkは係数です
  • X1, X2, ..., Xkは項の値です。各項は1つの予測変数、多項式の項、または交互作用項になり得ます。

Minitabは式と変数設定を使用して、適合値を計算します。

変数設定

Minitabは回帰式と変数設定を使用して、適合値を計算します。変数設定が、モデルの推定に使用するデータと比較して異常な場合、予測の下に警告が表示されます。

変数設定表を使い、目的の分析が行われたかどうかを検証してください。

適合値

適合する値は、適合値またはとも呼ばれます。 適合した値は、予測変数の任意の値に対する平均応答の点推定です。予測変数の値は、X値とも呼ばれます。Minitabは回帰式と変数設定を使用して、適合値を計算します。

Minitabが表示する適合応答値の種類は、モデル内の応答変数の種類によって変わります。Minitabは、以下の種類の適合値を表示します。
  • 長さや重さなどの、連続測度が含まれる応答変数の平均。
  • サンプルごとの欠陥数などの、ポアソン分布に従うカウント数が含まれる応答変数の平均。
  • 合格・不合格などの、2つの可能性がある結果が含まれる応答変数の確率。
  • 変動性の分析を使用して適合されるモデルの標準偏差。

解釈

適合値は、X値を応答変数のモデル式に入力することで計算されます。

たとえば、式がy = 5 + 10xの場合に、X値が2ならば、適合値は25(25 = 5 + 10(2))となります。

適合値の標準誤差(SE Fit)

適合値の標準誤差(SE Fit)は、特定の変数設定について推定される平均応答の変動を推定します。平均応答の信頼区間の計算には、適合値の標準誤差が使用されます。標準誤差は常に正数です。

解釈

適合値の標準誤差は、平均応答の推定値の精度を測定するために使用します。標準誤差が小さいほど、予測される平均応答の精度は高くなります。たとえば、分析者が配達時間を予測するモデルを開発するとします。変数設定のひとつのセットに、モデルは3.80日の平均配達時間を予測します。これらの設定の適合値の標準誤差は0.08日です。変数設定の2つめのセットに、モデルは適合値の標準誤差の0.02日で同じ平均配達時間を生成します。分析者は、変数設定の2つめのセットの平均配達時間が3.80日近くであるということに、より自信を持つことができます。

適合値とともに、適合値の標準誤差を使用して、平均応答の信頼区間を作成できます。たとえば、自由度の数に基づいて、95%の信頼区間は予測平均から標準誤差のおよそ2個分の範囲になっています。配達時間では、標準誤差が0.08日の際の予測平均の3.80日の95%の信頼区間は、(3.64、3.96)日です。これは、95%の信頼度で、母集団の平均がこの範囲に含まれることを意味します。標準誤差が0.02日の際、95%の信頼区間は、(3.76、3.84)日です。変数設定の2つめのセットの信頼区間は、標準誤差がより小さいことから、より狭くなります。

95%の信頼区間(CI)

適合値の信頼区間は、指定された予測を条件として、応答平均値になる可能性のある値の範囲を表します。

解釈

信頼区間を使用して、変数の観測値に関する適合値の推定値を評価します。

たとえば、信頼水準が95%の場合は、モデル内の指定された値の変数を持つ母集団平均が含まれる信頼区間を95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広い場合、将来価値の平均値に対する信頼性が低くなります。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。

95%の予測区間(PI)

予測区間は、変数設定の選択された組み合わせの単一の将来の応答が含まれる可能性のある範囲です。

解釈

予測区間(PI)を使用して予測の精度を評価します。予測区間から、結果の実質的な有意性を評価できます。予測区間が許容範囲を超える場合は、予測は要求に対して十分に正確ではない可能性があります。

95%の予測区間の場合、95%の信頼度で、指定された予測を条件として、1つの応答が区間に含まれます。平均応答の場合と比較して、単一の応答を予測する際には不確実性が増加するので、予測区間は必ず信頼区間よりも広くなります。

たとえば、家具メーカーの材料技師は単回帰モデルを開発して、パーティクルボードの密度からそのボードの剛性を予測します。技師は、モデルが分析の仮定を満たすかどうかを検証します。その後、モデルを使用して、剛性を予測します。

回帰式では新しい観測値の剛性が、密度が25のとき-21.53 + 3.541*25、つまり66.995であることを予測します。こうした観測値の剛性値が厳密に66.995になる可能性は低いと考えられますが、予測区間は実際の値が95%の信頼度でおよそ48~86になるであろうことを示します。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください