Gewerkschaftsdatensätze

Man kann zwei Datensätze zu einem einzigen Datensatz kombinieren, indem man Zeilen aus einem Datensatz unter einen anderen stapelt. Das Unioning von Datensätzen ermöglicht es, ähnliche Daten aus mehreren Quellen für konsolidierte Analysen und Berichte zusammenzuführen.

Gewerkschaftsanforderungen

A Union kombiniert zwei Datensätze basierend auf einer oder mehreren gemeinsamen Spalten. Um eine Union zu konfigurieren, müssen Sie Folgendes angeben:

  • Mindestens zwei Dateneingaben. Wählen Sie einen Pipeline-Knoten aus, um dessen Datensatz zur Union hinzuzufügen.
  • Spaltenzuordnung für jeden Datensatz. Verwenden Sie es bei Bedarf ein. Kolumnen verwalten
  • Union-Typ

Dateneingaben hinzufügen und verwalten

Wählen Sie die Datensätze aus und geben Sie die Spaltenübereinstimmungen an, um eine erfolgreiche Union zu schaffen. Alle Datensätze sollten passende oder kompatible Spalten enthalten, damit die Daten im kombinierten Ergebnis korrekt übereinstimmen.

  1. Wähle die + Taste, um eine neue Eingabe hinzuzufügen.
  2. Wählen Sie den Pipeline-Knoten aus, der den Datensatz generiert, um ihn als Eingabe zu verwenden. Du kannst zwischen zwei und vier Eingängen haben.
  3. Wähle Kolumnen verwalten aus, um anzugeben, welche Spalten aufgenommen werden sollen und wie sie zugeordnet werden sollen.
    1. Wählen Sie die Spalten aus, die in den Ergebnisdatensatz aufgenommen werden sollen.
    2. Kartiere die Spalten für jeden Datensatz.
    Hinweis

    Wenn die Datentypen nicht übereinstimmen, wird die Ergebnisspalte in Text umgewandelt. Numerische Formate wie Prozentzahlen und Währungen werden in automatische numerische umgewandelt.

Die Spalten Data Center werden automatisch abgebildet, wenn die Spaltennamen übereinstimmen. Wenn die Spaltennamen jedoch nicht übereinstimmen, müssen Sie die Ergebnisspalte auswählen und die Spalten zuordnen, die nicht übereinstimmen.

Die beiden Eingaben haben unterschiedliche Spaltennamen für E-Mail-Adressen und Postleitzahlen.

Du entscheidest dich, die Ergebnisnamen E-Mail-Adresse und Postleitzahlzu verwenden, also belegst du den zweiten Datensatz entsprechend neu.

Tipp

Verwenden Sie die Filteroption, die Ihre Spaltenauswahl fokussiert. Wählen Sie Alle Spalten, Nicht zusammengewürfelte Säulen, oder Aktivierte Spalten.

Union-Typ

Union-Typ Ergebnisse
Einzigartige Reihen (UNION)

Zeilen von allen Eingaben entfernen und Duplikate entfernen, wenn alle Spaltenwerte übereinstimmen.

Alle Reihen (UNION ALLE)

Zeilen von allen Eingaben und behält Duplikate. Verwenden Sie, wenn wiederholte Reihen erwartet werden.

Einzigartige Reihen (UNION)

Kombiniert Zeilen aller Eingaben und entfernt Duplikate, wenn alle Spaltenwerte übereinstimmen. Nutzen Sie diese Option, wenn Sie eine bestimmte Liste von Unterlagen benötigen.

In diesem Beispiel erscheinen die Zeilen, die in beiden Eingaben erscheinen, nur einmal im Ergebnis.

  • C00393 / #0119 / Grundlegend
  • C00438 / #0122 / Pro

Alle Reihen (UNION ALLE)

Es kombiniert Zeilen aller Eingaben und behält Duplikate. Nutzen Sie diese Option, wenn doppelte Datensätze gültig sind.

In diesem Beispiel erscheinen die doppelten Zeilen zweimal im Ergebnis, weil sie in beiden Eingaben existieren.

  • C00393 / #0119 / Grundlegend
  • C00438 / #0122 / Pro