In diesem Beispiel ist ein Compliance-Team besorgt über die Genauigkeit der Betrugserkennung in der Automobilindustrie. Die Daten müssen jedoch vorbereitet werden, bevor mit der Analyse begonnen werden kann. Führen Sie die folgenden Schritte aus, um insurance_fraud_data.csv für die weitere Analyse vorzubereiten. Um diese Änderungen vorzunehmen, wählen Sie die Spalte aus und öffnen Sie das Optionen für die Datenvorbereitung Dropdown-Menü, um auf die Optionen zur Spaltenbereinigung zuzugreifen.
Ändern Sie claim_number den Datentyp von numerisch in Text.
Stellen Sie bei claim_number den Spaltenwerten # voran.
Filtern Sie age_of_driver so, dass nur Fahrer eingeschlossen werden, die kleiner oder gleich 100 Jahre alt sind.
Ändere M im Geschlecht in männlich und F in weiblich.
Filtern Sie bei annual_income so, dass nur Treiber eingeschlossen werden, die mehr als 1 erzeugen.
Ändern Sie address_change den Datentyp von numerisch in Text.
Ändern Sie address_change 1 in ja und 0 in nein.
Ändern Sie für die Postleitzahl den Datentyp von numerisch in text.
Verwenden Sie diese Option Erweiterte Sortierung, um nach Betrug, Verletzungsanspruch und Postleitzahl zu sortieren.
Exportieren von Schritten zur Datenvorbereitung
Nachdem Sie alle Vorbereitungsschritte angewendet haben, speichern Sie die Schritte, um sie für zukünftige Datasets mit denselben Spalten zu verwenden. Um die Schritte zu speichern, exportieren Sie sie als MDCS-Datei.
Wählen Sie im Bereich Schritte auf der linken Seite aus dem Dropdown-Menü aus Schritte exportieren.
Die Datei wird in Ihrem Download-Ordner oder an einem anderen Speicherort gespeichert und verwendet denselben Namen wie Ihre Datendatei. Ändern Sie den Namen entsprechend.
Schritte zur Datenvorbereitung importieren
Um die Schritte auf eine neue Datendatei anzuwenden, importieren Sie sie als
MDCS-Datei. Wählen Sie aus dem Dropdown-Menü im Bereich aus Schritte importierenSchritte.
Erkunden von Datenzusammenfassungen
Jede Spalte verfügt über eine Zusammenfassung, die die Form der Daten, den Bereich der Daten und ein Symbol für den Datentyp anzeigt.
Ein kurzer Blick auf die grafischen Zusammenfassungen der Spalte zeigt, dass der Kanal 3 Ebenen hat und die geöffneten Tage eine bimodale Verteilung zeigen.
Öffnen Sie die Datenzusammenfassung, um weitere Informationen zu den Zusammenfassungsstatistiken für diese Spalten zu erhalten.
Die Datenzusammenfassung für den Kanal zeigt die Häufigkeit für jede der 3 Stufen.
Weitere Vorgehensweise
Da die Daten für die offenen Tage auf zwei Verteilungen hindeuten, möchte die Versicherungsgesellschaft dies weiter untersuchen. Navigieren Sie zu Analysieren Sie Ihre Daten.