Mit Zahlen arbeiten

Auf dieser Seite wird erläutert, wie Sie numerische Berechnungen ausführen, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.

Sie können diese Transformationen in Spalten der folgenden Datentypen ausführen:

  • Ganzzahl
  • Dezimal
  • Doppelt
  • Float
  • Long
  • Kurz

Weitere Informationen finden Sie in der set-column-Anweisung.

Sie können numerische Funktionen auf eine oder mehrere Spalten anwenden. Die verfügbaren numerischen variieren je nach Anzahl der ausgewählten Spalten. Sie können eine neue Spalte mit den Ergebnissen der Berechnungen erstellen. Alternativ können Sie werden in der Spalte angezeigt, in der Sie die Transformation hinzufügen.

Wenn Sie einen numerischen Wert auf eine einzelne Spalte anwenden, unterscheidet sich das Verhalten von der Anwendung einer in mehrere Spalten verschieben. Beispiel:

  • Wenn Sie die Multiply()-Funktion auf eine einzelne Spalte anwenden, geben Sie die Dezimalwert, mit dem jeder Wert in der Spalte multipliziert wird. Wrangler führt die Multiplikation mit den Beispieldaten durch und zeigt die neuen Werte in derselben Spalte oder in einer neuen Spalte an.
  • Wenn Sie die Funktion Multiply() auf mehrere Spalten anwenden, multipliziert Wrangler die Werte in jeder Zeile für die ausgewählten Spalten und zeigt die neuen Werte in der ersten Spalte der Transformation an.

Numerische Berechnungen für Werte in einer Spalte durchführen

So wenden Sie eine numerische Berechnung auf eine Spalte an:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten zu einem Spaltennamen arrow_drop_down Erweiterungspfeil.
  3. Klicken Sie auf Berechnen und wählen Sie eine Option aus, z. B. Hinzufügen.

    Bei einigen Funktionen müssen Sie eine Dezimalzahl eingeben, um die Berechnung abzuschließen. Wert. Wenn Sie beispielsweise Abziehen auswählen, müssen Sie den Wert eingeben, der von jeder Zeile abgezogen werden soll.

  4. Optional: Um eine neue Spalte für die berechneten Werte zu erstellen, wählen Sie das In eine neue Spalte kopieren.

  5. Klicken Sie auf Anwenden.

Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende als Schritt im Schema. Wenn Sie zum Beispiel jeweils 2 subtrahieren Wert in der Spalte Price hat, fügt Wrangler die folgende Transformation zum Rezept:

set-column :Price Price - 2

Wenn Sie die Datenpipeline ausführen, wird die Transformation auf alle Werte in der Spalte angewendet.

Unterstützte Berechnungen für eine Spalte

Sie können die folgenden Berechnungen für alle Werte in einer Spalte durchführen:

Funktion Beschreibung
Absoluter Wert Gibt den absoluten Wert für jeden Wert in einer Spalte zurück. Der absolute Wert von -10 ist beispielsweise 10.
Hinzufügen Fügt einer Spalte eine positive oder negative Dezimalzahl hinzu oder fügt mehrere Spalten, um die Summe jeder Zeile auszugeben.
Arccos Gibt die Umkehrfunktion des Kosinus für jeden Wert in einer Spalte zurück.
Bärchen Gibt den Kehrwert von sin für jeden Wert in einer Spalte zurück.
Arktis Gibt für jeden Wert in einer Spalte den Kehrwert der Tangente zurück.
Decke Gibt die kleinste Ganzzahl zurück, die größer oder gleich der numerischen in jeder Zelle einer Spalte einen Wert eingeben. Wenn der Wert beispielsweise 2,21 ist, gibt Ceil den Wert 3 zurück. Bei einem Wert von 5, 88 gibt die Ceil-Wert 6 zurück. Wenn der Wert -5,15, gibt Ceil -5 zurück.
Cos Gibt den Kosinus jedes Spaltenwerts zurück.
Würfel Erhöht jeden Wert in der Spalte auf die Potenz von 3.
Kubewurzel Gibt den Kubikwurzelwert jedes Werts in der Spalte zurück.
Teilen Teilt jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder teilt jeden Wert in zwei Spalten.
Etage Gibt die größte Ganzzahl zurück, die größer oder gleich dem numerischen Wert ist in jeder Zelle einer Spalte. Wenn der Wert beispielsweise 2, 21 ist, gibt FLOOR gibt 2 zurück. Bei einem Wert von 5, 88 gibt FLOOR 5 zurück. Wenn der Wert ist -5,15, FLOOR gibt -6 zurück.
Log Gibt den Logarithmus jedes Werts in einer Spalte zurück.
Modulo Gibt den Rest zurück, wenn jeder Wert in der Spalte durch a geteilt wird positive Dezimalzahl oder gibt den Rest zurück, wenn jeder Wert in zwei Spalten.
Multiplizieren Jeder Wert in der Spalte wird mit einer positiven oder negativen Dezimalzahl multipliziert. oder multipliziert jeden Wert in zwei Spalten.
Natürliches Log Gibt den natürlichen Logarithmus jedes Werts in einer Spalte zurück.
Potenzial von Setzt den Spaltenwert auf die angegebene Potenz des Werts.
Zufällig Generiert zufällige, unvorhersehbare Double-Werte in einer angegebenen Spalte.
Runde Rundet jeden Wert in einer Spalte.
Sin Gibt den Sin für jeden Wert in einer Spalte zurück.
Quadratformat Erhöht jeden Wert in der Spalte auf die Potenz von 2.
Quadratwurzel Gibt die Quadratwurzel jedes Werts in einer Spalte zurück.
Subtrahieren Subtrahiert eine positive oder negative Dezimalzahl von jedem Wert im Spalte.
Hellbraun Gibt die Tangente für jeden Wert in einer Spalte zurück.

Numerische Berechnungen für Werte in zwei Spalten ausführen

So wenden Sie eine numerische Berechnung auf zwei Spalten an:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten das Kästchen neben zwei Spaltennamen an.
  3. Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
  4. Klicken Sie auf Berechnen und wählen Sie eine Option aus, z. B. Hinzufügen.
  5. Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls überschreiben die berechneten Werte vorhandenen Werten.
  6. Klicken Sie auf Anwenden.

Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende als Schritt im Schema. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales und Q2_Sales addieren und eine neue Spalte namens H1_Sales erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation durch und erstellt eine neue Spalte namens H1_Sales mit der Gesamtsumme von Q1_Sales und Q2_Sales.

Unterstützte Berechnungen in zwei Spalten

Sie können die folgenden numerischen Berechnungen für Werte in jeder Zeile in zwei Spalten:

Funktion Beschreibung
Hinzufügen Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben.
Durchschnitt Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück.
Teilen Dividiert jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder dividiert jeden Wert in zwei Spalten.
Gleich Boolesche Funktion, die Zeile für Zeile prüft, ob die Werte in zwei Spalten übereinstimmen. Gibt true oder false zurück.
LCM-Richtlinie Gibt das kleinste gemeinsame Vielfache jeder Zahl in zwei Spalten zurück.
Max Gibt den Maximalwert für jede Zeile in zwei Spalten zurück.
Min. Gibt den Minimalwert für jede Zeile in zwei Spalten zurück.
Modulo Gibt den Rest zurück, wenn jeder Wert in der Spalte durch a geteilt wird positive Dezimalzahl oder gibt den Rest zurück, wenn jeder Wert durch zwei geteilt wird Spalten.
Multiplizieren Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten.
Subtrahieren Subtrahiert eine positive oder negative Dezimalzahl von jedem Wert im Spalte.

Numerische Berechnungen für Werte in drei oder mehr Spalten ausführen

Cloud Data Fusion unterstützt die Durchführung numerischer Berechnungen für Werte in mindestens drei Spalten in Version 6.8.0 und höher.

So wenden Sie eine numerische Berechnung auf drei oder mehr Spalten an:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten das Kästchen neben zwei Spaltennamen an.
  3. Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
  4. Klicken Sie auf Berechnen und wählen Sie eine Option aus, z. B. Hinzufügen.
  5. Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls überschreiben die berechneten Werte vorhandenen Werten.
  6. Klicken Sie auf Anwenden.

Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende als Schritt im Schema. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales, Q2_Sales, Q3_Sales und Q4_Sales addieren und eine neue Spalte namens 2022_Sales erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation durch und erstellt eine neue Spalte namens 2022_Sales mit der Summe von Q1_Sales, Q2_Sales, Q3_Sales und Q4_Sales.

Unterstützte Berechnungen in drei oder mehr Spalten

Sie können die folgenden Berechnungen für Werte in jeder Zeile in drei oder weitere Spalten:

Funktion Beschreibung
Hinzufügen Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben.
Durchschnitt Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück.
Gleich Boolesche Funktion, die zwei Spalten vergleicht, um festzustellen, ob Werte übereinstimmen, Zeile nach Zeile sortiert. Gibt true oder false zurück.
Max. Gibt den Maximalwert für jede Zeile in zwei Spalten zurück.
Min. Gibt den Minimalwert für jede Zeile in zwei Spalten zurück.
Multiplizieren Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten.

Nächste Schritte