分布の適合の評価にAnderson-Darling統計量を使用する方法

Anderson-Darling(AD)統計量は、データが特定の分布にどの程度適合するかを測定します。一般に、分布がデータに適合するほど、AD統計量は小さくなります。

AD統計量は、適合度検定のp値を計算するために使用され、この値はデータに最も良くあてはまる分布を判断するのに役立ちます。たとえば、個別の分布の識別を実行すると、各分布のAD統計量が計算されます。この統計量から計算されるp値を使用して、工程能力分析または信頼性分析にどの分布モデルを使用するのかを判断できます。AD統計量は、データのサンプルが指定された分布の母集団から得られたものかどうかを検定するのにも使用されます。たとえば、データがt検定の正規性の仮定を満たすかどうかを検定する必要があることがあります。

Anderson-Darling検定の仮説は次のとおりです。
  • H0: データは指定した分布に従っている。
  • H1: データは指定した分布に従っていない。

Anderson-Darling検定のp値が指定された有意水準よりも低い場合(通常0.05または0.10)、データは指定した分布に従っていないと結論付けます。Minitabでは、Anderson-Darling検定のp値が表示されないことがあります。

複数の分布の適合を比較する場合は、一般にp値が最も大きい分布がデータに最も良くあてはまります。分布のp値が非常に近い場合は、実務的な知識に基づいてどれか1つを選びます。

調整されたAnderson-Darling(AD*)統計量を生成するコマンドもあります。調整されていないAnderson-Darling統計量では、プロット点を計算するKaplan-Meier法に基づいたノンパラメトリックステップ関数を使用しています。一方、調整済みのAnderson-Darling統計量では、プロット点の計算に別の方法を使用しています。