Minitabにおける一般線形モデル(GLM)に含まれる参照水準の係数

一般線形モデル(GLM)では、回帰手法を使用してモデルを適合します。GLMでは因子水準を指標変数としてコード化した後で、それらを使用してすべての項の係数を計算します。係数の解釈は、指標変数が(-1, 0, +1)のコード化または(1, 0)のコード化のいずれかを使用するかによって異なります。(-1, 0, +1)のコード化を使用すると、係数は因子水準と全体平均の間の距離を表します。(1, 0)のコード化を使用すると、係数は他の因子水準とその因子の参照水準の差を表します。

どちらのタイプのコード化でも、水準の1つは参照水準です。Minitabでは、デフォルトで係数表に参照水準の係数がリストされません。場合によっては、参照値の大きさと方向が全体平均に対してどのように比較されるかを理解するために参照水準の係数を知る必要があることもあります。

参照水準の係数の表示方法

GLMでは、参照水準の係数は単一回帰式に表示されます。係数表で式を表示させるには、次の手順に従います。
  1. 統計 > 分散分析 > 一般線形モデル > 一般線形モデルの適合を選択します。
  2. 結果をクリックします。
  3. 係数係数のフルセットを選択します。
  4. 各ダイアログボックスでOKをクリックします。

参照水準の係数の計算方法

たとえば、2つの因子を使用して一般線形モデル検定を行うとします。因子1には3つの異なる設定(35、44、52)があります。因子2は2つの異なる時間(1と2)です。Minitabでは(-1, 0, +1)のコード化が使用されます。因子とその指標変数を次の表に示します。

因子1には3つの水準があるため、因子1には2つの指標変数があります。設定が35の場合、最初の指標変数は1で、2番目の指標変数は0です。設定が44の場合、最初の指標変数は0で、2番目の指標変数は1です。設定が52の場合、どちらの指標変数も-1です。設定が52の水準が参照水準です。
因子2 指標1 指標2
52 -1 -1
35 1 0
44 0 1
52 -1 -1
44 0 1
35 1 0
因子2では、時間が1の場合、指標変数も1です。時間が2の場合、指標変数は-1です。時間が2の水準が参照水準です。
因子1 指標
1 1
1 1
2 -1
2 -1
1 1
2 -1
次のような係数表を取得できます。
係数 係数の標 項 係数 準誤差 t値 p値 VIF 定数 68.22 1.28 53.36 0.000 設定 35 -27.64 1.81 -15.29 0.000 1.33 44 4.86 1.81 2.69 0.011 1.33 時間帯 1 -0.50 1.28 -0.39 0.698 1.00
分散分析モデルは次のとおりです。
回帰式 厚さ = 68.22 - 27.64 設定_35 + 4.86 設定_44 + 22.78 設定_52 - 0.50 時間帯_1 + 0.50 時間帯_2

この表には52(因子1)と2(因子2)の係数が含まれていない点に注意してください。これらは各因子の参照水準です。ただし、これらの値は、各水準の平均から全体平均を引けば容易に計算できます。定数項が全体平均です。

Minitabで各水準の平均を表示するには、次の手順を実行します。
  1. 統計 > 基本統計 > 記述統計量表示を選択します。
  2. 変数に応答変数を入力します。
  3. グループ変数 (オプション)に因子を入力します。
  4. OKをクリックします。

各因子についてこの手順を繰り返します。

例のデータの平均は次のようになります。
  • 全体 = 68.22
  • 設定35(因子1) = 40.583
  • 設定44(因子1) = 73.08
  • 設定52(因子1) = 91
  • 時間1(因子2) = 67.72
  • 時間2(因子2) = 68.72
係数は水準平均 - 全体平均と計算されます。したがって、各水準の係数は次のようになります。
  • 設定35(因子1) = 40.58 – 68.22 = –27.64
  • 設定44(因子1) = 73.08 − 68.22 = 4.86
  • 設定52(因子1) = 91 − 68.22 = 22.78(係数表には表示されません)
  • 時間1(因子2) = 67.72 − 68.22 = –0.5
  • 時間2(因子2) = 68.72 − 68.22 = 0.5(係数表には表示されません)

参照水準の係数をすばやく計算するには、因子の水準係数(切片は除く)を足し合わせたものに-1を掛けます。たとえば、設定52の係数は−1 * ((−27.64) + (4.86)) = 22.78となります。

共変量を追加する場合や、グループ内に等しくないサンプルサイズがある場合、係数は算術平均(nで割った観測値の和)ではなく、各因子水準の重み付き平均に基づいて計算されます。