Anderson-Darling統計量とは

Anderson-Darling統計量は、データが特定の分布にどの程度適合するかを測定します。特定のデータセットおよび分布に対して、分布がデータに適合するほど、この統計量は小さくなります。しかし、異なる分布で計算されたAnderson-Darling統計量は直接比較できません。そのため、Anderson-Darling値におけるわずかな差には、実用的な妥当性がありません。確率プロットとその他の情報を使用すると、異なる分布の適合度を比較できます。

調整済みAnderson-Darling統計量とは

Minitabでは分布識別プロットおよび信頼性/生存時間分析に使用する調整済みAnderson-Darling統計量が計算されます。この調整済みAnderson-Darling統計量は、出力時にAnderson-Darling(調整済み)またはAD*と表示されます。従来のAnderson-Darling統計量に対する調整により、統計値は確率プロット上に点をプロットする方法に依存するようになります。従来のAnderson-Darling統計量では常にKaplan-Meierプロット点法を使用します。

調整済みAnderson-Darling統計量のp値は、任意打ち切りまたは多様打ち切りデータに対しては計算できません。一貫性を保つため、Minitabでは、これらが使用可能な場合でもすべての信頼性のp値が表示されません。

Minitabでは、個別の分布の識別分析(品質ツール内)で未調整のAnderson-Darling統計量のp値が使用できます。この分析では、常に打ち切りなしデータに対してKaplan-Meierプロット点法が使用されます。調整済みAnderson-Darling統計量を信頼性分析で計算する方法の詳細については、パラメトリック分布分析(右打ち切り)における適合度の測度の方法と計算式で「Anderson-Darling統計量」をクリックします。

個別の分布の識別と信頼性/生存におけるAnderson-Darling統計量が異なる理由

グラフ > 確率プロットメニューや統計 > 品質ツール > 個別の分布の識別メニューでレポートされるAnderson-Darling統計量は調整されていません。一方、統計 > 信頼性/生存時間メニューのコマンドで得られるAnderson-Darling統計量は、打ち切りデータや異なるプロット点法に対応するために調整済みです。

2つの異なるAnderson-Darling統計量を比較するには、最尤推定法を使用し、プロット点の計算にKaplan-Meier法を使用します。

データが打ち切られていない場合でも、小さいサンプルに対して、調整済みAnderson-Darling統計量によって未調整Anderson-Darling統計量と同じ結果が得られるとは限りません。ただし、大きいサンプルサイズに対しては、2つのアプローチで同様の結果が得られます。

Anderson-Darling値の比較の例

これらの結果では、ワイブル分布のAnderson-Darling統計量が最も低い6.056になっています。しかし、Anderson-Darling統計量の値は対数正規分布と正規分布の値に近くなっています。

適合度 Anderson-Darling 分布 (調整済み) ワイブル 6.048 対数正規 6.165 指数 7.639 正規 6.076

確率プロットを調べて、点を結ぶステップ関数について考えるとすると、ワイブル分布、対数正規分布、正規分布はステップと適合線の間の領域が同様です。指数分布では領域がもっと大きくなります。

したがって、これらの結果では、対数正規とワイブルのAnderson-Darling値の差は実用的ではない可能性が高いといえます。異なる分布の百分位数の推定値が同様になる場合があります。指数とワイブルのAnderson-Darling値の差は実用的である可能性が高いといえます。