Bevor Betrugserkennungstrends analysiert werden, muss der Datensatz bereinigt und standardisiert werden. In diesem Abschnitt werden Sie:
Er Minitab Data Center verwendet eine Datenpipeline, um Ihre Daten vorzubereiten. Eine Pipeline ist eine Abfolge zusammenhängender Schritte, die Rohdaten in einen sauberen, analysetauglichen Datensatz umwandeln.
Jedes Data Center-Projekt enthält ein interaktives Pipeline-Diagramm, das die Datenverarbeitungsschritte darstellt. Ein typischer Pipeline-Fluss enthält folgende Knoten.
Datenquelle → Bereinigen → Merge/Reshape→ Ausgabe
Jeder Schritt erscheint als visueller Knoten in der Pipeline, was es leicht macht, Ihren Datenvorbereitungsprozess zu verstehen und wiederzuverwenden.
Datenquelle → Bereinigen → Ausgabe


Für weitere Informationen besuchen Sie die Optionen Datensatzschema verwalten oder Daten quellen festlegen.
Wann sollte man jede Ansicht verwenden:

Ändere claim_number Datentyp von numerisch zu Text.
Stellen Sie allen Anspruchsnummern das # -Symbol vor.
Warum das wichtig ist: Verhindert numerische Interpretation und bewahrt die Formatkonsistenz.
Warum das wichtig ist: Entfernt unrealistische Alter und ungültige Einkommenseinträge, die die Ergebnisse verzerren könnten.
Warum das wichtig ist: Standardisierte Kategorien verbessern die Lesbarkeit, Gruppierung und Berichterstattung.
Warum das wichtig ist: Bewahrt führende Nullen und verhindert unbeabsichtigte numerische Operationen.
Warum das wichtig ist: Sortieren hilft, betrugsbezogene Unterlagen effizient zu priorisieren und zu überprüfen.
Neben der Reinigung und Standardisierung von Daten müssen Sie möglicherweise Datensätze vor der Analyse kombinieren oder neu organisieren.
Für weitere Informationen besuchen Sie "Datensätze zusammenführen".
Weitere Informationen finden Sie unter Union-Datensätzen.
Für weitere Informationen besuchen Sie Transpose-Datensätze.
Sie Minitab Data Center bietet eine konversationelle Schnittstelle, die Ihre Datenvorbereitung in der Bereinigen Ansicht anleitet.
Für das obige Beispiel können Sie den folgenden Text in die Minitab AI Eingabeaufforderung eingeben, um die gleichen Ergebnisse wie bei den einzelnen Schritten zu erhalten.
Machen Sie Anspruchsnummern in Text. Fügen Sie das Zahlensymbol hinzu, um Zahlen zu beanspruchen. Entfernen Sie Treiber, die älter als hundert sind. Ändere m in männlich und f in weiblich. Entfernen Sie Fahrer, die kein gültiges Einkommen haben. Ändern Sie address_change in Text. Machen Sie 1 auf Ja und 0 auf Nein für Adressänderungen. Sortieren Sie nach Betrug, Verletzungsanspruch und Postleitzahl.
Für weitere Informationen zur Nutzung Minitab AI in , Data Centersiehe "Minitab AI, um Ihre Daten zu bereinigen".



Zum Beispiel hat der Kanal 3 Ebenen und Offenheitstage zeigt eine bimodale Verteilung.


Die Datenzusammenfassung für den Kanal zeigt die Häufigkeit für jede der 3 Stufen.

Verwenden Sie das Rechtsklickmenü, um das Gruppierungslabel zu bearbeiten, die Gruppe aus dem Datensatz auszuschließen oder nur die Zeilen anzuzeigen, die diesen Wert enthalten.
Da die Daten für die offenen Tage auf zwei Verteilungen hindeuten, möchte die Versicherungsgesellschaft dies weiter untersuchen. Navigieren Sie zu Analysieren Sie Ihre Daten.