古典的線形モデルの一般化線形モデルへの拡張には2つのパートがあります。指数族の分布とリンク関数です。
1つ目のパートは、線型モデルを「指数族」と呼ばれる大きな分布族の一部である応答変数に拡張することです。指数分布族の一部には、以下のような一般形で観測された応答の確率分布関数があります。
上記の式では、a(∙)、b(∙)、c(∙)は応答変数の分布によって変化します。パラメータθは、しばしば「正準パラメータ」と呼ばれる位置母数パラメータのことを指し、ϕは分散パラメータと呼ばれます。通常、関数a(ϕ)はa(ϕ)= ϕ/ ωという式が成立します(Minitabでは、重みが関数a(ϕ)に設定されている場合はこれに合わせて調整を行います)。
指数族の一部は、離散分布または連続分布になることがあります。指数族の一部となる連続分布の例として、正規分布やガンマ分布があります。指数族の一部となる離散分布の例には、二項分布とポアソン分布があります。以下の表には、このうち幾つかの分布の特徴を記載しています。
分布 | ϕ | b(θ) | a(φ) | c(y, ϕ) |
正規 | σ2 | θ2/2 | φω | |
二項 | 1 | φ/ω | -ln(y!) | |
ポアソン | 1 | exp(θ) | φ/ω |
2つ目のパートはリンク関数です。リンク関数は、i番目の観測値の平均応答を以下の線形予測変数の式に関連付けます。
古典的線型モデルは、リンク関数が恒等関数になるような一般的な形式化の特殊ケースです。
2つ目のパートにおけるリンク関数の選択は、1つ目のパートの指数族の特定の分布によって変わります。特に、指数族の各分布には「正準リンク関数」と呼ばれる特殊なリンク関数があります。このリンク関数はg (μi) = Xi'β= θという方程式を満たし、θが正準パラメータにあたります。正準リンク関数により、このモデルの望ましい統計的性質が得られます。異なるリンク関数の適合度を比較するには、適合度の統計量を使うことができます。それまでの経緯や各分野での特殊な意味合いに応じ、使われるリンク関数は異なります。たとえば、logitリンク関数の利点の1つは、オッズ比の推定値が得られるという点です。別な例を挙げると、normitリンク関数は、2値カテゴリに分分類される正規分布に従った、基礎変数があると仮定します。
Minitabでは3種類のリンク関数が用意されています。異なるリンク関数により、より幅の広いデータに十分に適合するモデルを見つけることができます。リンク関数はlogit、normit(probitとも呼ばれる)、gompit(相補的log-logとも呼ばれる)です。これらは、標準累積ロジスティック分布関数の逆関数(logit)、標準累積正規分布関数の逆関数(normit)、ゴンペルツ分布関数の逆関数(gompit)です。logitは二項モデルの正準リンク関数であるため、logitはデフォルトのリンク関数です。
モデル | 名前 | リンク関数、g(μi) |
二項 | logit | |
二項 | normit(probit) | |
二項 | gompit(相補的log-log) |
用語 | 説明 |
---|---|
μi | i行目の平均応答 |
g(μi) | リンク関数 |
X | 予測変数のベクトル |
β | 予測変数に関連する係数のベクトル |
正規分布の逆累積分布関数 |
データセット内の1組の因子/共変量の値を説明します。因子/共変量パターンごとに、事象確率、残差、およびその他の診断測定値が計算されます。
たとえば、データセットに性別や人種の因子、年代の共変量が含まれている場合、これらの予測変数の組み合わせには、統計対象と同じ数のさまざまな共変量パターンが含まれている可能性があります。データセットに人種や性別の因子のみが含まれ、それぞれ2つの水準でコード化されている場合は、4つの因子/共変量パターンしかありません。データを、頻度または成功、試行、もしくは失敗として入力する場合、各行には1つの因子/共変量パターンが含まれます。
計画行列には、指定したモデルの適合に回帰を使用する一般線形モデル(GLM)に使用されるのと同じアプローチが使用されます。Minitabでは、まず因子と指定したモデルから計画行列が作成されます。この行列のXと呼ばれる列はモデルに含まれる項を表しています。
ブロックの場合、列の数はブロックの数より1つ少なくなります。
2水準計画では計画因子の項は1列になります。交互作用項も1列になります。
水準A | A1 | A2 | A3 |
---|---|---|---|
1 | 1 | 0 | 0 |
2 | 0 | 1 | 0 |
3 | 0 | 0 | 1 |
4 | -1 | -1 | -1 |
交互作用項の列を計算するには、交互作用項にある因子の対応する列の積を求めます。たとえば、因子Aに6つの水準があり、Cに3つの水準があり、Dに4つの水準があるとします。項A * C * Dの列は5 × 2 × 3 = 30となります。水準を取得するには、Aの列に、C、Dの各列を掛けます。
Minitabでは二値応答で分割実験計画は分析されません。
分割実験計画の場合、Minitabでは2つのバージョンの計画行列が使用されます。1つ目のバージョンは2水準実施要因計画で使用される行列と同じものです。もう一方の行列にはプロット全体を表す列のブロックが含まれます。例として、プロット全体の誤差項の計算には2つ目のバージョンの計画行列が使用されます。プロット全体の列は変更が難しい因子の列および変更が難しい因子のみを含む交互作用の列に続きます。