安定性分析の予測のすべての統計量

安定性分析の予測で使用されるすべての統計量の定義と解釈について解説します。

回帰式

回帰式を使用して、モデルにおける応答と項の関係を表します。回帰式は回帰線の代数で表現されます。線形モデルの回帰式は次の形式を取ります:Y= b0 + b1x1。回帰式では、Yが応答変数、b0が定数または切片、b1が線形項の推定係数(線の傾き)、x1が項の値を表します。

1つ以上の項を持つ回帰式は、次の形式を取ります。

y = b0 + b1X1 + b2X2 + ... + bkXk

回帰式において、各文字は以下を表します。
  • yは応答変数です
  • b0は定数です
  • b1, b2, ..., bkは係数です
  • X1, X2, ..., Xkは項の値です

モデルに連続変数とカテゴリ変数の両方が含まれる場合、回帰式表にはカテゴリ変数の水準の各組み合わせに対する式を表示することができます。これらの式を予測に使うには、カテゴリ変数の値に基づき正しい式を選択し、連続変数の値を入力する必要があります。

変数設定

モデルは、変数が予測を計算するために設定を使用します。変数設定が、Minitabによりモデルの推定に使用するデータと比較して異常な場合、予測の下に警告が表示されます。

適合値

適合する値は、適合値またはとも呼ばれます。 適合値は、予測変数に与えられた値に対する平均応答の点推定です。予測変数の値はx値とも呼ばれます。

解釈

適合値は、データセットに含まれる観測値ごとの特定のx値をモデル式に入力することによって計算されます。

たとえば、式がy = 5 + 10xの場合に、X値が2ならば、適合値は25(25 = 5 + 10(2))となります。

Minitabは、データの値と比較して異常な予測値を持つ予測に注釈を加えます。古いサンプルでさらに検定するだけで、保存期間推定値が正確であるかを確認できます。

適合値の標準誤差(SE Fit)

適合値の標準誤差(SE Fit)は、特定の変数設定について推定される平均応答の変動を推定します。平均応答の信頼区間の計算には、適合値の標準誤差が使用されます。標準誤差は常に正数です。

解釈

適合値の標準誤差は、平均応答の推定値の精度を測定するために使用します。標準誤差が小さいほど、予測される平均応答の精度は高くなります。たとえば、分析者が配達時間を予測するモデルを開発するとします。変数設定のひとつのセットに、モデルは3.80日の平均配達時間を予測します。これらの設定の適合値の標準誤差は0.08日です。変数設定の2つめのセットに、モデルは適合値の標準誤差の0.02日で同じ平均配達時間を生成します。分析者は、変数設定の2つめのセットの平均配達時間が3.80日近くであるということに、より自信を持つことができます。

適合値とともに、適合値の標準誤差を使用して、平均応答の信頼区間を作成できます。たとえば、自由度の数に基づいて、95%の信頼区間は予測平均から標準誤差のおよそ2個分の範囲になっています。配達時間では、標準誤差が0.08日の際の予測平均の3.80日の95%の信頼区間は、(3.64、3.96)日です。これは、95%の信頼度で、母集団の平均がこの範囲に含まれることを意味します。標準誤差が0.02日の際、95%の信頼区間は、(3.76、3.84)日です。変数設定の2つめのセットの信頼区間は、標準誤差がより小さいことから、より狭くなります。

適合信頼区間(95%信頼区間)

これらの信頼区間は、モデルに含まれる因子や予測変数の観測値を持つ、母集団の平均応答を含む可能性が高い値の幅です。

データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
点推定は、サンプルデータから算出されるパラメータの推定値です。信頼区間は、この値を中心にして得られます。
誤差幅
誤差幅は、信頼区間の幅を定義し、サンプル、サンプルサイズ、信頼水準において観測された変動性によって決定します。信頼区間の上限を算出するには、誤差幅を点推定に加算します。信頼区間の下側限界を算出するには、点推定から誤差幅を減算します。

解釈

信頼区間を使用して、変数の観測値に関する適合値の推定値を評価します。

たとえば、信頼水準が95%の場合、モデルに含まれる因子や予測変数における特定の値の母平均が信頼区間に含まれていることが95%信頼できます。信頼区間は、結果の実質的な有意性を評価するのに役立ちます。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広い場合は、将来の平均値の信頼度は下がります。信頼区間が広すぎて有用でない場合は、サンプルサイズを増やすことを検討します。

95% 予測区間(PI)

予測区間は、変数設定の選択された組み合わせに関する1つの将来の応答が含まれる可能性のある範囲です。予測区間は、対応する信頼区間よりも必ず広くなります。

解釈

例えば、品質技師は、新しい医薬品の保存期間が54.79か月であると判断したとします。この分析の保存期間は、最も不適切なバッチの濃度が想定濃度の90%であることを品質技師が95%も信頼することはできない期間として定義されます。技師は、54.79か月において最も不適切なバッチの平均濃度を予測したいと考えます。

これらの結果では、平均応答の予測は約91.36%です。しかし、技師は、バッチ2から1錠の錠剤に対する値の範囲を推定したいとも考えています。予測区間は、54.79か月時点でのバッチ2の1錠の錠剤に対する予測濃度がおよそ89.3217~93.4001%にあることを95%信頼できることを示しています。

設定 変数 設定 月 54.79 バッチ 2 予測 適合値の標 適合値 準誤差 95%信頼区間 95%予測区間 91.3609 0.801867 (89.7233, 92.9986) (89.3217, 93.4001) XX XXは、モデルの適合に使用される予測変数水準を基準にする非常に異常な点を表しま す。
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください