Daten filtern

Auf dieser Seite wird erläutert, wie Sie beim Vorbereiten von Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio filtern. In Wrangler können Sie Zeilen mit Daten in Spalten mit beliebigen Datentypen filtern, mit Ausnahme des booleschen Typs. Sie behalten oder entfernen Zeilen basierend auf einer von Ihnen konfigurierten Bedingung.

So können Sie Zeilen basierend auf einer Bedingung beibehalten oder entfernen:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten auf den Namen einer Spalte und dann auf den arrow_drop_down-Pfeil zum Maximieren der Spalte.
  3. Wählen Sie Filter und dann eine Option aus, z. B. Zeilen beibehalten und Wenn Wert enthält.
  4. Geben Sie die Bedingung an.
  5. Klicken Sie auf Anwenden.

Die Werte ändern sich je nach Filter. Wrangler fügt die filter-rows-on hinzu. zum Rezept hinzu. Wenn Sie die Datenpipeline ausführen, auf die Werte in der Spalte angewendet.

Zeilen beibehalten

Wenn Sie Zeilen auf der Grundlage einer Bedingung beibehalten möchten, werden Zeilen entfernt, die die Bedingung nicht erfüllen. Im Datensatz verbleiben nur die Zeilen, die die Bedingung erfüllen. Wenn Sie beispielsweise Wert ist auswählen und die Bedingung eingeben, Customer, behält Wrangler Zeilen mit dem String Customer bei und entfernt Zeilen mit anderen Werten.

Zeilen entfernen

Wenn Sie Zeilen basierend auf einer Bedingung entfernen, werden Zeilen, die die Bedingung erfüllen, aus dem Datensatz entfernt. Wenn Sie beispielsweise Zeilen entfernen und value ist leer, entfernt Wrangler Zeilen aus der Spalte, die leer oder null sind. Werte.

Unterstützte Filterbedingungen

Sie können Zeilen nach den folgenden Bedingungen filtern:

Bedingung Beschreibung
Wert ist leer Behält oder entfernt Werte mit leeren Werten.
Wert ist Behält oder entfernt Werte mit dem genau angegebenen Wert. Bei Spalten mit dem Datentyp „String“ können Sie die Groß- und Kleinschreibung ignorieren. Standardmäßig ist die Groß-/Kleinschreibung in der Bedingung enthalten.
Wert enthält Behält oder entfernt Werte, die den angegebenen Wert enthalten.
Wert beginnt mit Behält oder entfernt Werte, die mit dem angegebenen Wert beginnen.
Wert endet mit Behält oder entfernt Werte, die mit dem angegebenen Wert enden.
stimmt mit regulärem Ausdruck überein Behält oder entfernt Werte, die dem regulären Ausdruck entsprechen.
Benutzerdefinierte Bedingung Behält oder entfernt Werte, die der benutzerdefinierten Bedingung entsprechen.

Nächste Schritte