Auf dieser Seite wird erläutert, wie Sie beim Vorbereiten von Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio filtern. In Wrangler können Sie Zeilen mit Daten in Spalten mit beliebigen Datentypen filtern, mit Ausnahme des booleschen Typs. Sie behalten oder entfernen Zeilen basierend auf einer von Ihnen konfigurierten Bedingung.
So behalten oder entfernen Sie Zeilen basierend auf einer Bedingung:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten auf den Namen einer Spalte und dann auf den arrow_drop_down-Pfeil zum Maximieren der Spalte.
- Wählen Sie Filter und dann eine Option aus, z. B. Zeilen beibehalten und Wenn Wert enthält.
- Geben Sie die Bedingung an.
- Klicken Sie auf Übernehmen.
Die Werte ändern sich je nach Filter. Wrangler fügt dem Rezept die Anweisung filter-rows-on
hinzu. Wenn Sie die Datenpipeline ausführen, wird die Transformation auf die Werte in der Spalte angewendet.
Zeilen beibehalten
Wenn Sie Zeilen auf der Grundlage einer Bedingung beibehalten möchten, werden Zeilen entfernt, die die Bedingung nicht erfüllen. Im Datensatz verbleiben nur die Zeilen, die die Bedingung erfüllen. Wenn Sie beispielsweise value is auswählen und die Bedingung Customer
eingeben, behält Wrangler Zeilen mit dem String Customer
bei und entfernt Zeilen mit anderen Werten.
Zeilen entfernen
Wenn Sie Zeilen basierend auf einer Bedingung entfernen, werden Zeilen, die die Bedingung erfüllen, aus dem Datensatz entfernt. Wenn Sie beispielsweise Zeilen entfernen und value is empty auswählen, entfernt Wrangler Zeilen aus der Spalte, die leere oder Nullwerte enthalten.
Unterstützte Filterbedingungen
Sie können Zeilen nach den folgenden Bedingungen filtern:
Bedingung | Beschreibung |
---|---|
value ist leer | Behält oder entfernt Werte mit leeren Werten. |
Wert ist | Behält oder entfernt Werte mit dem genau angegebenen Wert. Bei Spalten mit dem Datentyp „String“ können Sie die Groß- und Kleinschreibung ignorieren. Standardmäßig ist die Groß- und Kleinschreibung in der Bedingung enthalten. |
Wert enthält | Behält oder entfernt Werte, die den angegebenen Wert enthalten. |
Wert beginnt mit | Behält oder entfernt Werte, die mit dem angegebenen Wert beginnen. |
Wert endet mit | Behält oder entfernt Werte, die mit dem angegebenen Wert enden. |
stimmt mit dem Regex überein | Behält oder entfernt Werte, die mit dem regulären Ausdruck übereinstimmen. |
Benutzerdefinierte Bedingung | Behält oder entfernt Werte, die der benutzerdefinierten Bedingung entsprechen. |