ユニオンデータセット

2つのデータセットを1つのデータセットにまとめると、あるデータセットの行を別のデータセットの下に重ねてまとめることができます。データセットをユニオンすることで、複数のソースからの類似データをまとめて分析と報告を行うことができます。

組合の要件

ユニオン は、1つ以上の一般的なカラムに基づく2つのデータセットを組み合わせます。ユニオンを設定するには、以下のことを指定する必要があります:

  • 少なくとも2つのデータ入力が必要です。パイプラインノードを選択して、そのデータセットをユニオンに追加します。
  • 各データセットのカラムマッピング。必要なら使 カラム管理
  • ユニオンタイプ

データ入力の追加と管理

データセットを選択し、一致する列を指定することで成功した結合を作成できます。すべてのデータセットには、データが正しく整合するような一致または互換性のある列が含まれるべきです。

  1. + ボタンを選択して 新しい入力を追加してください。
  2. データセットを生成するパイプラインノードを選択して入力として使用します。 入力は2つから4つまであります。
  3. どの列を含めるか、どのようにマッチングするかを指定するには カラム管理 を選択してください。
    1. 結果データセットに含める列を選択します。
    2. 各データセットの列をマッピングします。

    データ型が一致しない場合は、結果列をテキストに変換します。パーセンテージや通貨などの数値形式は自動数値に変換されます。

Data Center 列名が一致すると自動的に列をマッピングします。しかし、列名が一致しない場合は、結果の列を選び、一致しない列をマッピングしなければなりません。

2つの入力はメールアドレスと郵便番号の列名が異なります。

結果名は メールアドレス郵便番号を使うことに決め、2つ目のデータセットをそれに応じて再マッピングします。

ヒント

カラム選択を集中させるフィルターオプションを使ってください。 すべての列ミスマッチド・カラム、または 有効カラムを選択します。

ユニオンタイプ

ユニオンタイプ 結果
ユニーク・ローズ(UNION)

すべての入力から行を切り出し、すべての列の値が一致すると重複を削除します。

全列(UNION ALL)

すべての入力から行を分け、重複を保持します。繰り返しの列が予想される場合に使用してください。

ユニーク・ローズ(UNION)

すべての入力の行を統合し、すべての列の値が一致すると重複を削除します。特定のレコードリストが必要な場合はこのオプションをご利用ください。

この例では、両方の入力に現れる行は結果に一度だけ現れます。

  • C00393 / #0119 / 基本
  • C00438 / #0122 / プロ

全列(UNION ALL)

すべての入力の行を組み合わせて重複を保持します。重複記録が有効な場合はこのオプションを使用してください。

この例では、重複行は両方の入力に存在するため結果に2回現れます。

  • C00393 / #0119 / 基本
  • C00438 / #0122 / プロ