コレログラムのデータに関する考慮事項

データには、少なくとも2列の数値データを含める必要がある
各列の行数は同じでなければなりません。テキストまたは日付/時刻データを含む列を含めることはできません。
データは連続量または順位でなければならない
カテゴリデータがある場合は、変数間の関連を調べるためにクロス集計とカイニ乗を実行します。
サンプルサイズが小さくてはいけない
相関曲線に必要なデータの量に関する正式なガイドラインは存在しませんが、サンプルの量が多ければ多いほど、データ内のパターンは明確になります。
標本データは無作為に選択される
統計では、ランダムサンプルを使用して母集団についての一般化または推定を行います。データがランダムに収集されていなければ、結果は母集団とならない可能性があります。
変数間の関係は線形でなければならない
変数に線形関係がない場合、コレログラムは関係の強さを正確には反映しません。他の関係を探すために行列散布図を調べます。
異常な値は結果に大きな影響を与えるかもしれない
異常な値は結果に大きな影響を与えるかもしれないため、行列散布図を使用してこれらの値を識別します。外れ値を詳しく調べると、データや工程に有効な情報を得ることができます。