有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。
- データは数値でなければならない
- パッケージの重量などの連続データや、顧客からの苦情の数などの離散データが必要です。 度数データのサンプルを要約する場合は、個別変数毎合計を使用します。
- サンプルデータはランダムに選択される
-
統計では、ランダムサンプルを使用して母集団についての一般化または推定を行います。データがランダムに収集されていなければ、結果は母集団とならない可能性があります。詳細は、データのサンプルにおけるランダム性を参照してください。
- 中規模から大規模のデータサンプルを収集する
- 少なくとも20個の観測値を持つサンプルであれば、データの分布を表すのに十分です。しかしながら、より分かりやすくヒストグラムで分布を表すには少なくとも50個の観測値が必要であると推奨する主張もあります。サンプルサイズが大きいほど、平均や標準偏差などの工程パラメータをより正確に推定できます。