決定的スクリーニング計画の2値応答を分析の推定式を求める方法と計算式

このトピックの内容

係数
係数の標準誤差
Z
p値（P）
2値ロジスティック回帰のオッズ比
信頼区間
分散共分散行列

係数

係数の最大尤推定値をみつける方法は2つあります。1つ目は、係数に関する尤度関数を直接最大化する方法です。これらの式は係数において非線形です。もう一つは、反復再重み付け最小二乗法を使用する方法であり、Minitabを使用して係数の推定値を得る方法です。マッカロックとネルダー¹は、2つの方法が等しいことを示しています。ただし、反復再重み付け最小二乗法の方が容易に実行できます。詳細は1を参照してくてください。

[1] P. McCullagh、J. A. Nelder（1989）Generalized Linear Models第2版、Chapman & Hall/CRC、ロンドン

係数の標準誤差

i番目の係数の標準誤差は、分散共分散行列のi番目の対角要素の正の平方根です。分散共分散行列には以下の形式があります。

Wは対角行列であり、対角要素は以下の計算式によって求められます。

ここで

この分散共分散行列は、フィッシャーの情報行列とは対照的に、観測されたヘッセ行列に基づきます。結果を出すモデルは条件付き平均誤特定よりもロバスト性が高いため、Minitabでは観測されたヘッセ行列を使用します。

正準リンクが使用された場合、観測されたヘッセ行列とフィッシャーの情報行列は等しくなります。

表記

用語	説明
y_i	i行目の応答値
	i行目の推定平均応答
V(·)	以下の表に記載されている分散関数
g(·)	リンク関数
V '(·)	分散関数の1番目の導関数
g'(·)	リンク関数の1番目の導関数
g''(·)	リンク関数の2番目の導関数

以下の式では、二項モデルの特定の各寄与度を求めます。

詳細は、[1]および[2]を参照してください。

[1] A. Agresti（1990年）Categorical Data Analysis、John Wiley & Sons, Inc.

[2] P. McCullagh、J.A. Nelder（1992年）Generalized Linear Model、Chapman & Hall

Z

予測変数が応答と有意な関係があるかどうかを判断するZ統計量。Zの大きい方の絶対値は有意な関係を示します。計算式は以下になります。

表記

用語	説明
Z_i	標準正規分布の検定統計量
	推定係数
	推定された係数の標準誤差

サンプルが小さい場合、尤度比検定は、より信頼できる有意性検定になり得ます。尤度比p値は逸脱度表に記載されています。サンプルのサイズが十分に大きい場合、Z統計量のp値は尤度比統計量のp値に近似します。

p値（P）

p値は、仮説検定で帰無仮説を棄却できるかどうかを決定するために使用されます。p値は帰無仮説が真の場合に、実際の計算値と少なくとも同程度以上の極端な検定統計量が得られる確率です。p値用によく使用されるカットオフ値は0.05です。たとえば、検定統計量の計算されたp値が0.05未満の場合、帰無仮説を棄却します。

2値ロジスティック回帰のオッズ比

2値応答をもつモデルのlogitリンク関数を選択した場合のみオッズ比が設定されます。このケースでは、オッズ比は、予測変数と応答の関係を解釈するのに役立ちます。

オッズ比（τ）はどのような非負数値にもなり得ます。オッズ比=1は、比較の基線になります。τ = 1の場合、応答と予測変数に関係はありません。τ < 1の場合、事象のオッズは、因子の参照水準に対して（または、より低い水準の連続予測変数に対して）高くなります。τ > 1の場合、事象のオッズは、因子の参照水準に対して（または、より低い水準の連続予測変数に対して）低くなります。値が1から離れるほど、関連度がより強くなることを表します。

注

2値ロジスティック回帰モデルが共変量または因子を持つ場合、成功の推定オッズは以下になります。

指数の関係によりβの解釈が得られます。オッズは、xが1単位増加する度にe^β₁の倍数で増加します。オッズ比はexp(β₁)と等しくなります。

たとえばβが0.75の場合、オッズ比はexp(0.75)であり、2.11となります。これは、xが1単位増加する度に成功のオッズが111%増加することを示しています。

表記

用語	説明
	データ内のi行目の成功の推定確率
	推定切片係数
	予測変数xの推定係数
	i行目のデータ点

信頼区間

推定された係数のサンプルの信頼区間が大きい場合は以下になります。

2値ロジスティック回帰について、Minitabはオッズ比の信頼区間を提供します。オッズ比の信頼区間を得るには、信頼区間の下限と上限をべき乗します。信頼区間は、オッズが予測変数の単位当たり変化量ごとに存在する範囲を示します。

表記

用語	説明
	i番目の係数
	における標準正規分布の逆累積確率
	有意水準
	推定された係数の標準誤差

分散共分散行列

d × dの行列では、dは予測変数の個数に1を足した数です。各係数の分散は対角セル内に、係数1対ごとの共分散は、適切な非対角セル内にあります。分散は、係数を二乗したものの標準誤差です。

分散共分散行列は、情報行列を逆行列にして最後に反復したときに得られます。分散共分散行列には次の式があります。

Wは対角行列であり、対角要素は以下の計算式によって求められます。

ここで

正準リンクが使用された場合、観測されたヘッセ行列とフィッシャーの情報行列は等しくなります。

表記

用語	説明
y_i	i行目の応答値
	i行目の推定平均応答
V(·)	以下の表に記載されている分散関数
g(·)	リンク関数
V '(·)	分散関数の1番目の導関数
g'(·)	リンク関数の1番目の導関数
g''(·)	リンク関数の2番目の導関数

以下の式では、二項モデルの特定の各寄与度を求めます。

詳細は、[1]および[2]を参照してください。

[1] A. Agresti（1990年）Categorical Data Analysis、John Wiley & Sons, Inc.

[2] P. McCullagh、J.A. Nelder（1992年）Generalized Linear Model、Chapman & Hall