結合データセット

共通の列値に基づいて行を照合することで、2つのデータセットを1つのデータセットにまとめることができます。データセットを統合することで、関連情報をまとめて分析や報告を行うことで、データを豊かにすることができます。

結合要件

結合 は、1つ以上の一般的なカラムに基づく2つのデータセットを組み合わせます。ジョインを設定するには、以下のことを指定する必要があります:

  • 一次データセット: 結果の基礎となるメインデータセットです。
  • 二次データセット: このデータセットは、主要なデータセットと結合されます。
  • 結合条件: 各データセットの行がどのようにマッチングされるかを定義する少なくとも1つの結合条件が必要です。
  • 結合タイプ: マッチしない行の扱い方を定義します。

結合条件を追加

結合条件 を使って、2つのデータセットの行がどのようにマッチングされるかを定義します。各条件は、最初のデータセットの1列と2つ目のデータセットの対応する列をペアにします。

  1. 一次データセットと二次データセットを指定してください。
  2. 両方のデータセットから1列を選択して最初の結合条件を完成させます。+ ボタンを選択して 新しい条件行を追加してください。各行は1列の比較を表します。
  3. 一致する列を選択します。 各条件について:
    • 左側のドロップダウンを使って最初のデータセットから列を選択します。
    • 右側のドロップダウンを使って、2つ目のデータセットから一致する列を選択します。

    選択された列には関連する値(ID、名前、コードなど)が含まれなければなりません。完全一致(Equals =)のみがサポートされています。

  4. 複数の条件を追加して、行のマッチングを細かく調整できます。 複数の条件が適用される場合:
    • 行が一致するにはすべての条件が真でなければなりません。
    • これは AND の比較のようなものです。
    たとえば、
    • メールアドレス が一致する
    • AND 郵便番号は 郵便番号と一致します
    ヒント

    条件行の X を選択すると条件を解除できます。

以下のガイドラインを使ってマッチングの精度を高めましょう。
  • 選択する列に比較可能なデータが含まれていることを確認してください。例えば、両方の数値または両方のテキスト欄を使うことができます。
  • 最適な結果を得るには、スペースや大文字の使い方など一貫したフォーマットを使いましょう。
  • 1つのジョイン構成ごとに最大10のジョイン条件を定義できます。

カラム管理

結合結果に含まれる列の一部またはすべての列を選択します。必要に応じて列名を変更することができます。

サンプル値は入力データから最も一般的な値を示します。

結合タイプ

結合タイプ 結果
プライマリー(左の結合) プライマリデータセットのすべての行と、セカンダリーデータセットのマッチ
マッチングのみ(内側の結合) 両方のデータセットで一致する行のみを選びます
全フィールド(FULL JOIN) 両方のデータセットのすべての行

プライマリー(左の結合)

結合条件に基づいて、プライマリデータセットのすべての行とセカンダリデータセットの一致する行を返します。一致が見つからない場合は、二次データセットの列の欠損値を返します。

マッチングのみ(内側の結合)

結合条件に基づいて両方のデータセットで一致する行のみを返します。一致しない行は結果から除外されます。

全フィールド(FULL JOIN)

両方のデータセットからすべての行を返します。行が一致すると、その列は1行にまとめられます。一致がない場合は、マッチしないデータセットの列に欠損値を使用します。