ポアソンモデルの当てはめの分散分析の方法と計算式

目的の方法または計算式を選択してください。

このトピックの内容

分散分析
自由度（DF）
対数尤度
p値（P）

分散分析

逸脱度は、現在のモデルと完全モデルの誤差を測定します。完全モデルは、n個のパラメータ（観測値ごとに1つのパラメータ）があるモデルです。完全モデルは対数尤度関数を最大化します。完全モデルは、nよりも少ないパラメータを持つモデルの類似点を導き出します。完全モデルの比較では、スケール逸脱度を使用します。

個々のデータ点のスケール逸脱度に対する寄与度はモデルに依存します。

モデル	逸脱度
二項
ポアソン

逸脱度表は、ϕが既知であると仮定して導き出される以下の一般的な結果に基づいて解釈されます。D_Iが初期モデルと関連のある逸脱度であり、D_Sが初期モデルのサブセットの項と関連する逸脱度である場合、いくつかの正則条件下では、以下のような関係があります。

逸脱度間の差は、d個の自由度を持つカイ二乗分布として漸近的に分布します。これらの統計量は調整済み（タイプIII）分析と連続（タイプI）分析用に計算されます。調整済み逸脱度と逸脱度表のカイ二乗統計量は等しくなります。調整済み平均逸脱度は、調整済み逸脱度を自由度で除算したものです。

逐次分析の場合、出力結果は、予測変数がモデルに入力される順序によって変わります。逐次逸脱度はモデル内に予測変数が既にあることを前提として、予測変数が説明する逸脱度の固有部です。モデルにX1、X2、X3の3つの予測変数がある場合、X3の逐次逸脱度は、モデル内にX1、X2が既にあることを前提として、これらの残りの逸脱度の値を明らかにします。異なる逐次逸脱度を得るには、異なる順序で予測変数を入力する回帰手法を繰り返します。

ϕが未知である場合、正規分布に基づく応答に関しては、正則条件下で以下のような関係の変化があります。

ここでは、逸脱度間の差は、分子にd個の自由度、分母にn − p個の自由度を持つF分布として漸近的に分布します。分散パラメータを推定するには、初期モデルを使用します。

表記

用語	説明
y_i	i行目の事象数
	i行目の推定平均応答
m_i	i行目の試行数
L_f	完全モデルの対数尤度
L_c	完全モデルのサブセットの項を持つモデルの対数尤度
d	自由度は、比較するモデル内のパラメータ数の差です
ϕ	分散パラメータ（二項モデルやポアソンモデルでは1として知られている）
n	データの行数
p	初期モデルの回帰自由度

自由度（DF）

調整済み平均逸脱度を計算するのに必要な応答データを含む独立した情報の数を示します。モデルの各構成要素の自由度は以下になります。

変動要因	自由度（DF）
回帰	p
誤差	n − p − 1
合計	n − 1
連続予測変数	1
カテゴリ予測変数	q − 1

表記

用語	説明
p	予測変数の自由度の和。予測変数に定数は含まれません。
n	データセットに含まれる観測値の数。
q	カテゴリ予測変数の水準数

対数尤度

対数尤度関数は、パラメータを平均に換算して表します。関数の一般形は以下になります。

各寄与度の一般形は以下になります。

各寄与度の具体的な形式はモデルによって変わります。

モデル	l_i
二項
ポアソン

表記

用語	説明
y_i	i行目の事象数
m_i	i行目の試行数
	i行目の推定平均応答

p値（P）

p値は、仮説検定で帰無仮説を棄却できるかどうかを決定するために使用されます。p値は帰無仮説が真の場合に、実際の計算値と少なくとも同程度以上の極端な検定統計量が得られる確率です。p値用によく使用されるカットオフ値は0.05です。たとえば、検定統計量の計算されたp値が0.05未満の場合、帰無仮説を棄却します。