ポアソンの適合度検定のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

データは、コールセンターへの1時間あたりの電話の数や、出荷品の単位あたりの欠陥数など、単位あたりの度数でなければならない

長さ、重量、温度などの連続データがあり、データが正規分布に従うかどうかを判定する場合は、正規性検定を使用します。

サンプルデータはランダムに選択される

統計では、ランダムサンプルを使用して母集団についての一般化または推定を行います。データがランダムに収集されていなければ、結果は母集団とならない可能性があります。詳細は、データのサンプルにおけるランダム性を参照してください。

各カテゴリの期待度数は小さすぎないようにしなければならない

カテゴリの期待度数(期待頻度)が5より小さい場合は、検定の結果が正しくない可能性があります。カテゴリの期待度数が低すぎる場合、最小限の期待度数を得るために、隣接するカテゴリと結合できることもあります。

たとえば、ある財務部門では、請求の延滞日数を分類するために、15日以下、16~30日、31~45日、46~60日、61日以上の5つのカテゴリを設定しているとします。61日以上のカテゴリの期待度数が小さいため、財務部門では、これを46~60日のカテゴリと組み合わせて46日以上のカテゴリを作成します。