À partir de votre aperçu des données, décidez des étapes de données nécessaires pour nettoyer les données. Pour plus d’informations, consultez la page Étapes de préparation des données.
Dans cet exemple, nous collectons des données sur les réclamations d’assurance pour les accidents de voiture. Étant donné que nous avons des données similaires dans de nombreux fichiers, nous voulons enregistrer nos étapes de préparation des données pour les appliquer à de nouveaux ensembles de données. Nous avons créé 8 étapes de données :
- Nettoyage initial pour réduire les espaces et formater les dates de manière appropriée.
- Supprimez les lignes non valides dont l’âge du conducteur est supérieur à 100 ans.
- Remplacez M par mâle.
- Remplacez F par femelle.
- Modifiez l’état civil du type de données numérique au type de données texte.
- Remplacez 0 par non.
- Remplacez 1 par oui.
- Fusionnez le sexe et l’état civil dans une seule colonne.
