分散分析モデルにおける階数不足とフルランク

「階数不足」のメッセージ

因子水準の組み合わせあたりの観測値数が十分にあり、モデルに含まれているすべての項を推定できるとき、その線形モデルをフルランクと言います。モデルに適合させるデータに十分な観測値がない場合、Minitabではモデルが適合できるまで項が取り除かれます。他のモデルの方がデータに良好に適合する可能性もあります。

たとえば、2因子GLMモデルがあるとします。このモデルを項A BおよびA*Bに適合しようとして、「階数不足」についてのエラーが表示されました。これは、因子水準の組み合わせあたりの観測数が足りないことを示しています。交互作用項(A*B)を削除してください。

階数不足とは

階数不足は、Minitabが行列計算を実行するのを妨げる恐れのある状態です。たとえば、次のような2つの予測変数と1つの応答変数が含まれるデータセットで考えてみます。

C1 C2 C3
X1 X2 Y
1.5 9.7 15.0
1.4 8.4 14.0
1.6 8.6 16.0
1.7 8.9 17.0
1.7 8.1 14.5

X1とX2は予測変数で、Yは応答変数です。Minitabの回帰分析では、最小二乗を使用して次の一次方程式の係数の推定値b0、b1、b2を計算します。

Y = b0 + b1X1 + b2X2

最小二乗の手順は次の行列式を解く手順と同じです。

b = (XTX)-1XTY

上の式で、bはモデル係数の推定値を含む列ベクトルで、Xは先頭の列が1(傾きまたは定数の推定に使用されます)で、残りの列には予測データ(X1、X2、...)が含まれる行列です。Yは応答データの列ベクトルになります。前のデータセットでは、行列は次のようになります。

Minitabでは、QR分解によりパラメータ(b0、 b1、b2)の推定値とパラメータの標準偏差が計算されます。計算は行列(XTX)の固有値によって異なります。(XTX)の固有値が基本的に0の場合、正方行列(XTX)は特異であるか、または特異に近く、Minitabでは計算を実行できなくなります。

階数不足の原因

階数不足は他のX列の線形の組み合わせとして書くことができるX変数列がある場合に起こります。以下は2つの例を示しており、C1、C2、C3を予測(X)変数として使用しています。

例1

C1 C2 C3
X1 X2 X3
1 2 3
2 3 5
1.5 2.5 4

例2

C1 C2 C3
X1 X2 X3
1 2 3
2 4 5
1.5 3 4

最初の例では、C1 + C2 = C3である点に注意してください。

2番目の例では、2*C1 = C2である点に注意してください。

これらの予測変数を使用して回帰(または分散分析)を実行しようとすると、Minitabで分析を実行するためにモデルから項が取り除かれます。

階数不足はカテゴリデータでも起こる可能性があります。

例3

C1 C2 C3
機械 測定者 応答
1 ジョエル 15
1 ジョエル 18
1 ジョエル 17
2 ビル 14
2 ビル 15
2 ビル 16

この例では、機械列が測定者列とまったく同じパターンになっている点に注意してください。このデータセットで分散分析を実行すると、Minitabで分析を実行するためにモデルから項が取り除かれます。

分散分析(ANOVA)を実行する場合、階数不足は次の理由によっても起こる可能性があります。
  • 含まれている交互作用項に、因子水準の各組み合わせについて少なくとも1つの観測値がない。たとえば、Aに3つの水準、Bに4つの水準があり、A*B交互作用がモデルに含まれ、因子水準の12個の組み合わせすべてで少なくとも1つの観測値がない場合です。
  • アンバランスな枝分かれがあります。
  • モデル内の連続変数が、共変量として指定されていません。
  • 誤差に対する自由度が負の値です。