一般線形モデルとは

一般線形モデルと最小二乗回帰は、どちらも応答変数と1つ以上の予測変数の関係を調べる際に使用します。それらの実質的な差は、一般線形モデルの手法が通常はカテゴリ応答変数とともに使用されることにあります。最小二乗回帰の手法は、連続応答変数とともに使用されるのが一般的です。一般線形モデルの詳細説明は1を参照してください。

一般線形モデルと最小二乗回帰は、どちらもモデルのパラメータを推定するため、モデルの当てはまりが最適化されます。最小二乗法では、誤差平方和の最小化によりパラメータの最尤推定値が得られます。一般線形モデルでは、反復重み付け最小二乗法を使用してパラメータの最尤推定値が得られます。

たとえば、一般線形モデルを使用して、機械工の経験年数(非負連続変数)と任意参加のトレーニングプログラムへの参加(是または非の2値変数)の関係を調べ、出来上がった製品が仕様に合っているかどうか(是または非の2値変数)を予測することができます。最初の2つの変数は予測変数で、3番目の変数はカテゴリ応答変数です。

ロジスティック回帰のタイプ

Minitabには、1つ以上の予測変数と次のタイプの応答変数間の関係を評価するために、4つの一般線形モデルの手法が用意されています。前述の例では、応答変数に2つの水準があるため、2値ロジスティック回帰を使用します。

変数の型 カテゴリの数 特性

2値

2

2水準

合格・不合格

はい・いいえ

高・低

順序

3以上

自然順序の水準

味(甘口、中辛、辛口)

容態(危篤、重症、安定、良好)

調査結果(そうは思わない、どちらでもない、そう思う)

名義

3以上

自然順序でない水準

味(苦い、甘い、酸っぱい)

色(赤、青、黒)

教科(数学、科学、美術)

ポアソン

3以上

応答変数は有限な観測空間で事象が発生した回数を表す

0, 1, 2, ...

1つの連続予測変数と2値の応答変数があるモデルの場合、5つの手法を利用できます。2値の適合線プロットでは、予測変数と応答の関係を簡単に把握できます。

1 P. McCullagh、J. A. Nelder(1992年)『Generalized Linear Models』、Chapman & Hall.