Beispiel für die Vorbereitung von Daten

Verwenden Sie Tools zur Datenvorbereitung, um Ihre Daten für robustere Analysen zu organisieren und vorzubereiten.

Schritte zur Datenvorbereitung

In diesem Beispiel ist ein Compliance-Team besorgt über die Genauigkeit der Betrugserkennung in der Automobilindustrie. Die Daten müssen jedoch vorbereitet werden, bevor mit der Analyse begonnen werden kann. Führen Sie die folgenden Schritte aus, um insurance_fraud_data.csv für die weitere Analyse vorzubereiten. Um diese Änderungen vorzunehmen, wählen Sie die Spalte aus und öffnen Sie sie Optionen für die Datenvorbereitung, um auf die Optionen zur Spaltenbereinigung zuzugreifen.
  1. Öffnen Sie Daten zu Versicherungsbetrug in Minitab Data Center.
  2. Ändern Sie claim_number den Datentyp von numerisch in Text.
  3. Stellen Sie bei claim_number den Spaltenwerten # voran.
  4. Filtern Sie age_of_driver so, dass nur Fahrer eingeschlossen werden, die kleiner oder gleich 100 Jahre alt sind.
  5. Ändere M im Geschlecht in männlich und F in weiblich.
  6. Filtern Sie bei annual_income so, dass nur Treiber eingeschlossen werden, die mehr als 1 erzeugen.
  7. Ändern Sie address_change den Datentyp von numerisch in Text.
  8. Ändern Sie address_change 1 in ja und 0 in nein.
  9. Ändern Sie für die Postleitzahl den Datentyp von numerisch in text.
  10. Verwenden Sie diese Option Erweiterte Sortierung um nach Betrug, Verletzungsanspruch und Postleitzahl zu sortieren.

Exportieren von Schritten zur Datenvorbereitung

Nachdem Sie alle Vorbereitungsschritte angewendet haben, speichern Sie die Schritte, um sie für zukünftige Datasets mit denselben Spalten zu verwenden. Um die Schritte zu speichern, exportieren Sie sie als MDCS-Datei.
  1. Wählen Sie im Bereich Schritte aus dem Dropdown-Menü aus Schritte exportieren.
  2. Die Datei wird in Ihrem Download-Ordner oder an einem anderen Speicherort gespeichert und verwendet denselben Namen wie Ihre Datendatei. Ändern Sie den Namen entsprechend.

Schritte zur Datenvorbereitung importieren

Um die Schritte auf eine neue Datendatei anzuwenden, importieren Sie sie als MDCS-Datei. Wählen Sie aus dem Dropdown-Menü im Bereich aus Schritte importieren Schritte.

Erkunden von Datenzusammenfassungen

Jede Spalte verfügt über eine Zusammenfassung, die die Form der Daten, den Bereich der Daten und ein Symbol für den Datentyp anzeigt.

Ein kurzer Blick auf die grafischen Zusammenfassungen der Spalte zeigt, dass der Kanal 3 Ebenen hat und die geöffneten Tage eine bimodale Verteilung zeigen.

Öffnen Sie die, Datenzusammenfassung um weitere Informationen zu den Zusammenfassungsstatistiken für diese Spalten zu erhalten.

Die Datenzusammenfassung für den Kanal zeigt die Häufigkeit für jede der 3 Stufen.

Weitere Vorgehensweise

Da die Daten für die offenen Tage auf zwei Verteilungen hindeuten, möchte die Versicherungsgesellschaft dies weiter untersuchen. Rufen Sie Beispiel für die Analyse von Daten auf.