Bereiten Sie Ihre Daten vor

Verwenden Sie Tools zur Datenvorbereitung, um Ihre Daten für robustere Analysen zu organisieren und vorzubereiten.

Öffnen der Datenquelle

Von der Minitab Solution Center Startseite aus können Sie auf die Minitab Data Center.
  1. Wählen Sie auf der Startseite des Solution Centers die Option aus Datenvorbereitung.
  2. Wählen Sie Daten hinzufügen aus. Melden Sie sich bei einem Online-Repository an. Sie können auch eine lokale Datendatei hinzufügen.
  3. Navigieren Sie zum Speicherort der Datei, und wählen Sie Öffnendann aus.
Ein schematisches Diagramm stellt die Schritte der Datenverarbeitung dar.
Säuberungsaktion ansehen
Sie können mit der Bereinigung Ihrer Daten beginnen, wenn Sie sich in der Säuberungsaktion Ansicht befinden.
Datenquelle ansehen
Wenn Sie das Datensatzschema oder Einstellungen ändern müssen, die sich auf den gesamten Datensatz auswirken, wählen Sie das Symbol für die Datenquellendatei aus, um das Optionen Fenster zu öffnen.

Weitere Informationen finden Sie unter Bearbeiten des Datensatzschemas oder Festlegen von Optionen für Datenquellen.

Schritte zur Datenvorbereitung

In diesem Beispiel ist ein Compliance-Team besorgt über die Genauigkeit der Betrugserkennung in der Automobilindustrie. Die Daten müssen jedoch vorbereitet werden, bevor mit der Analyse begonnen werden kann. Führen Sie die folgenden Schritte aus, um insurance_fraud_data.csv für die weitere Analyse vorzubereiten.
  1. Öffnen Sie Daten zu Versicherungsbetrug in Minitab Data Center.
  2. Stellen Sie sicher, dass Sie sich in der Säuberungsaktion Ansicht befinden.
  3. Wählen Sie die Spalte aus und öffnen Sie das Optionen für die Datenvorbereitung Dropdown-Menü, um auf die Optionen zur Spaltenbereinigung zuzugreifen.
  4. Ändern Sie claim_number den Datentyp von numerisch in Text.
  5. Stellen Sie bei claim_number den Spaltenwerten # voran.
  6. Filtern Sie age_of_driver so, dass nur Fahrer eingeschlossen werden, die kleiner oder gleich 100 Jahre alt sind.
  7. Ändere M im Geschlecht in männlich und F in weiblich.
  8. Filtern Sie bei annual_income so, dass nur Treiber eingeschlossen werden, die mehr als 1 erzeugen.
  9. Ändern Sie address_change den Datentyp von numerisch in Text.
  10. Ändern Sie address_change 1 in ja und 0 in nein.
  11. Ändern Sie für die Postleitzahl den Datentyp von numerisch in text.
  12. Verwenden Sie diese Option Erweiterte Sortierung, um nach Betrug, Verletzungsanspruch und Postleitzahl zu sortieren.

Verwenden von Minitab AI zum Bereinigen von Daten

Die Minitab Data Center bietet eine Konversationsschnittstelle, die Ihre Datenvorbereitung in der Säuberungsaktion Ansicht steuert. Für das obige Beispiel können Sie den folgenden Text in die Minitab AI Eingabeaufforderung eingeben, um die gleichen Ergebnisse wie bei den einzelnen Schritten zu erhalten.

Machen Sie Anspruchsnummern in Text. Fügen Sie das Zahlensymbol hinzu, um Zahlen zu beanspruchen. Entfernen Sie Treiber, die älter als hundert sind. Ändere m in männlich und f in weiblich. Entfernen Sie Fahrer, die kein gültiges Einkommen haben. Ändern Sie address_change in Text. Machen Sie 1 auf Ja und 0 auf Nein für Adressänderungen. Sortieren Sie nach Betrug, Verletzungsanspruch und Postleitzahl.

Weitere Informationen zur Verwendung Minitab AI in der Data Centerfinden Sie unter Verwenden von Minitab AI zum Bereinigen von Daten.

Exportieren von Schritten zur Datenvorbereitung

Nachdem Sie alle Vorbereitungsschritte angewendet haben, speichern Sie die Schritte, um sie für zukünftige Datasets mit denselben Spalten zu verwenden. Um die Schritte zu speichern, exportieren Sie sie als MDCS-Datei.
  1. Wählen Sie im Bereich Schritte auf der linken Seite aus dem Dropdown-Menü aus Schritte exportieren.
  2. Die Datei wird in Ihrem Download-Ordner oder an einem anderen Speicherort gespeichert und verwendet denselben Namen wie Ihre Datendatei. Ändern Sie den Namen entsprechend.

Schritte zur Datenvorbereitung importieren

Um die Schritte auf eine neue Datendatei anzuwenden, importieren Sie sie als MDCS-Datei. Wählen Sie aus dem Dropdown-Menü im Bereich aus Schritte importieren Schritte .

Erkunden von Datenzusammenfassungen

Jede Spalte verfügt über eine Zusammenfassung, die die Form der Daten, den Bereich der Daten und ein Symbol für den Datentyp anzeigt.

Ein kurzer Blick auf die grafischen Zusammenfassungen der Spalte zeigt, dass der Kanal 3 Ebenen hat und die geöffneten Tage eine bimodale Verteilung zeigen.

Öffnen Sie die Datenzusammenfassung, um weitere Informationen zu den Zusammenfassungsstatistiken für diese Spalten zu erhalten.

Die Datenzusammenfassung für den Kanal zeigt die Häufigkeit für jede der 3 Stufen.

Verwenden Sie das Kontextmenü, um die Gruppierungsbeschriftung zu bearbeiten, die Gruppe aus dem Datensatz auszuschließen oder nur die Zeilen anzuzeigen, die diesen Wert enthalten.

Weitere Vorgehensweise

Da die Daten für die offenen Tage auf zwei Verteilungen hindeuten, möchte die Versicherungsgesellschaft dies weiter untersuchen. Navigieren Sie zu Analysieren Sie Ihre Daten.