Exemple de préparation des données

Utilisez des outils de préparation des données pour organiser et préparer vos données en vue d’analyses plus robustes.

Étapes de préparation des données

Dans cet exemple, une équipe de conformité s’inquiète de la précision de la détection des fraudes dans l’industrie automobile. Cependant, les données doivent être préparées avant de pouvoir commencer l’analyse. Suivez ces étapes pour préparer insurance_fraud_data.csv une analyse plus approfondie. Pour effectuer ces modifications, sélectionnez la colonne et ouvrez-la Options de préparation des données pour accéder aux options de nettoyage de colonne.
  1. Ouvrez Données sur la fraude à l’assurance dans le fichier Minitab Data Center.
  2. Pour claim_number, remplacez le type de données numérique par texte.
  3. Pour claim_number, ajoutez # aux valeurs de colonne.
  4. Par age_of_driver, filtrez pour n’inclure que les pilotes âgés de moins de 100 ans.
  5. Dans le sexe, remplacez M par masculin et F par féminin.
  6. Par annual_income, filtrez pour n’inclure que les pilotes qui en font plus de 1.
  7. Pour address_change, remplacez le type de données numérique par texte.
  8. Dans address_change, remplacez 1 par oui et 0 par non.
  9. Pour Code postal, remplacez le type de données numérique par texte.
  10. Permet Tri avancé de trier par fraude, réclamation pour blessure et code postal.

Étapes de préparation des données d’exportation

Après avoir appliqué toutes les étapes de préparation, enregistrez les étapes à utiliser pour les futurs ensembles de données avec les mêmes colonnes. Pour enregistrer les étapes, exportez-les sous forme de fichier .mdcs.
  1. Dans le volet Étapes, sélectionnez Étapes d’exportation dans le menu déroulant.
  2. Le fichier est enregistré dans votre dossier de téléchargements ou à un autre emplacement de sauvegarde et porte le même nom que votre fichier de données. Modifiez le nom en conséquence.

Étapes de préparation des données d’importation

Pour appliquer les étapes à un nouveau fichier de données, importez-les en tant que fichier .mdcs. Sélectionnez Étapes d’importation dans le menu déroulant du Etapes volet.

Explorer les résumés de données

Chaque colonne comporte un résumé qui indique la forme des données, la plage des données et une icône qui représente le type de données.

Un rapide coup d’œil aux résumés graphiques des colonnes montre que le canal a 3 niveaux et les jours ouverts montre une distribution bimodale.

Ouvrez le pour Résumé des données obtenir plus d’informations sur les statistiques récapitulatives de ces colonnes.

Le résumé des données pour le canal indique la fréquence de chacun des 3 niveaux.

Et maintenant...

Étant donné que les données pour les jours ouverts indiquent deux distributions, la compagnie d’assurance souhaite examiner cela plus en détail. Accédez à Exemple d’analyse de données.