Rejoindre des ensembles de données

Vous pouvez combiner deux jeux de données en un seul ensemble de données en faisant correspondre les lignes selon des valeurs de colonnes communes. Rejoindre des jeux de données vous permet d’enrichir vos données en rassemblant des informations connexes pour analyse et rapport.

Exigences d’adhésion

A Joindre combine deux ensembles de données basés sur une ou plusieurs colonnes communes. Pour configurer une jointure, vous devez spécifier ce qui suit :

  • Ensemble de données principal: Le jeu de données principal qui constitue la base du résultat.
  • Ensemble de données secondaire: Le jeu de données qui sera combiné avec le jeu de données principal.
  • Conditions de jointure: Au moins une condition de jointure définit comment les lignes de chaque jeu de données sont appariées.
  • Type de jointure: Définit comment les lignes non appariées sont gérées.

Ajouter une condition de jointure

Utilisez Conditions de jointure pour définir comment les lignes de deux ensembles de données sont appariées. Chaque condition associe une colonne du premier jeu de données à une colonne correspondante du second jeu de données.

  1. Spécifiez les ensembles de données primaire et secondaire.
  2. Sélectionnez une colonne parmi les deux jeux de données pour compléter la première condition de jointure. Sélectionnez le bouton + pour ajouter de nouvelles lignes de condition. Chaque ligne représente une comparaison de colonne.
  3. Sélectionnez les colonnes correspondantes. Pour chaque condition :
    • Utilisez le menu déroulant de gauche pour sélectionner une colonne du premier jeu de données.
    • Utilisez le menu déroulant de droite pour sélectionner la colonne correspondante du second jeu de données.
    Remarque

    Les colonnes sélectionnées doivent contenir des valeurs apparentées (telles que des IDs, des noms ou des codes). Seules les correspondances exactes (Égal =) sont prises en charge.

  4. Vous pouvez ajouter plusieurs conditions pour affiner la façon dont les lignes sont associées. Lorsque plusieurs conditions sont utilisées :
    • Toutes les conditions doivent être vraies pour que les rangées correspondent.
    • Cela fonctionne comme une comparaison ET .
    Par exemple :
    • L’email correspond à l’adresse email
    • Le code postal AND correspond au code postal
    Conseil

    Sélectionnez X sur une ligne de condition pour supprimer la condition.

Utilisez les directives suivantes pour améliorer la précision des appariements.
  • Assurez-vous que les colonnes sélectionnées contiennent des données comparables. Par exemple, utilisez à la fois les colonnes numériques ou les deux colonnes de texte.
  • Utilisez une mise en forme cohérente, comme l’espacement et la capitalisation, pour obtenir de meilleurs résultats.
  • Vous pouvez définir jusqu’à dix conditions de jointure par configuration de jointure.

Gérer les colonnes

Sélectionnez certaines ou toutes les colonnes à inclure dans les résultats de jointure. Vous pouvez renommer les colonnes si besoin.
Remarque

Les valeurs d’échantillon montrent les valeurs les plus courantes issues des données d’entrée.

Type de jointure

Type de jointure Résultats
Primaire (JOINT À GAUCHE) Toutes les lignes du jeu de données primaire, plus les correspondances du jeu de données secondaire
Appariement uniquement (JOINT INTERNE) Seules les lignes correspondant dans les deux ensembles de données
Tous les champs (JOINTURE COMPLÈTE) Toutes les lignes provenant des deux ensembles de données

Primaire (JOINT À GAUCHE)

Retourne toutes les lignes du jeu de données primaire et les lignes correspondantes du jeu de données secondaire en fonction des conditions de jointure. Si aucune correspondance n’est trouvée, les valeurs manquantes sont retournées pour les colonnes secondaires du jeu de données.

Appariement uniquement (JOINT INTERNE)

Ne renvoie que les lignes qui ont une correspondance dans les deux ensembles de données selon les conditions de jointure. Les lignes sans correspondance sont exclues du résultat.

Tous les champs (JOINTURE COMPLÈTE)

Retourne toutes les lignes des deux jeux de données. Lorsque les lignes correspondent, leurs colonnes sont combinées en une seule ligne. Lorsqu’aucune correspondance n’existe, les valeurs manquantes sont utilisées pour les colonnes du jeu de données non apparié.