グラフでデータを最も効果的に表現する場合には、次のガイドラインを考慮します。
- 数値データまたは日付・時刻データの列のペアをデータに含める必要があります。
- 各列の行数は同じでなければなりません。
- サンプルサイズは中から大でなければなりません。
- 散布図と周辺部のグラフの種類のサンプルサイズを検討する必要があります。散布図に必要なデータの量に関する正式なガイドラインは存在しませんが、サンプルの量が多ければ多いほど、データ内のパターンは明確になります。ヒストグラムと箱ひげ図は、サンプルサイズが少なくとも20の場合に最適です。ドットプロットは、サンプルサイズがおおよそ50より小さい場合に最適です。サンプルサイズが50以上の場合、ドットは2つ以上の観測値を表すことがあります。
- サンプルデータはランダムに選択される必要がある
- 統計では、ランダムサンプルを使用して母集団についての一般化または推定を行います。データの収集がランダムではない場合、結果には母集団は表示されません。