用語 | 説明 |
---|---|
Y | 応答のベクトル |
X | 計画行列 |
β | パラメータのベクトル |
ε | 独立した正規確率変数のベクトル |
一般線形モデルは、回帰手法を使って指定したモデルを適合します。Minitabでは、まず因子と共変量から計画行列、および指定したモデルを作成します。この行列の列は、回帰分析の予測変数です。
計画行列はn行(n=観測値の数)およびモデル内の各項に対するいくつかの列ブロックを持ちます。最初のブロックは定数のためのブロックで1列しかなく、すべての列の値は1です。共変量のブロックにも、共変量自体の1列だけが含まれます。因子のブロックにはr列(r=因子の自由度)あり、以下の例に示すようにコード化されています。
ここで、4つの水準を持つ因子Aについて考えます。この因子には3つの自由度があり、このブロックには、A1、A2、A3と呼ばれる3つの列が含まれるとします。
水準A | A1 | A2 | A3 |
---|---|---|---|
1 | 1 | 0 | 0 |
2 | 0 | 1 | 0 |
3 | 0 | 0 | 1 |
4 | –1 | –1 | –1 |
次に、因子Bに、Aの各水準の中に含まれる3つの枝分かれした水準があるものとします。この場合、このブロックには、B11、B12、B21、B22、B31、B32、B41、B42と呼ばれる(3 - 1) x 4 = 8列が含まれ、次のようにコード化されます。
水準A | 水準B | B11 | B12 | B21 | B22 | B31 | B32 | B41 | B42 |
---|---|---|---|---|---|---|---|---|---|
1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 2 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 3 | –1 | –1 | 0 | 0 | 0 | 0 | 0 | 0 |
2 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
2 | 2 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
2 | 3 | 0 | 0 | –1 | –1 | 0 | 0 | 0 | 0 |
3 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
3 | 2 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 |
3 | 3 | 0 | 0 | 0 | 0 | –1 | –1 | 0 | 0 |
4 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
4 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
4 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | –1 | –1 |
交互作用項の列を計算するには、交互作用項にある因子または共変量、あるいはその両方の対応する列すべての積を求めます。たとえば、因子Aに6つの水準があり、Cに3つの水準があり、Dに4つの水準があり、ZとWが共変量であるとします。項A * C * D * Z * W * Wの列は5 × 2 × 3 × 1 × 1 × 1 = 30となります。これらを取得するには、Aの列に、C、Dの各列、共変量Zを1回、およびWを2回掛けます。
ボックスーコックス変換では、以下に示す通り、二乗値の残差合計を最小化するλ値が選択されます。出力される変換は、λ ≠ 0の場合にYλ、およびλ = 0の場合にln(Y)です。λ < 0の場合に、変換済み応答に−1を掛けて、変換されていない応答の順序を維持します。
−2~2の範囲で最適値が検索されます。値がこの区間外になった場合、適合性が低下することがあります。
以下は一般的な変換方法です(Y′はデータYの変換データ)。
ラムダ(λ)値 | 変換 |
---|---|
λ = 2 | Y′ = Y 2 |
λ = 0.5 | Y′ = |
λ = 0 | Y′ = ln(Y ) |
λ = −0.5 | |
λ = −1 | Y′ = −1 / Y |
重み付き最小二乗回帰は、観測値の分散が不均一な場合に用いられる手法です。分散が一定でない場合、
通常の重みの選択は、応答の純誤差分散の逆数です。
用語 | 説明 |
---|---|
X | 計画行列 |
X' | 計画行列の転置 |
W | 対角線に重みを配置したn×n行列 |
Y | 応答値のベクトル |
n | 観測値数 |
wi | i番目の観測値の重み値 |
yi | i番目の観測値の応答値 |
i番目の観測値の適合値 |
QR分解を使用してR2を計算する方が、最小二乗回帰を使用するより早く計算できます。
Minitabは、YをX2、X4、X5で回帰します。結果には、X1とX3は推定できず、モデルから削除されたというメッセージが含まれています。
GZLMセッションコマンドでTOLERANCEサブコマンドを使用すると、別の予測変数と相関が高い予測変数をモデル内に保持するように強制できます。ただし、公差を下げると、数値結果が不正確となる可能性があるため危険です。