Auf dieser Seite wird erläutert, wie Sie numerische Berechnungen ausführen, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.
Sie können diese Transformationen in Spalten mit den folgenden Datentypen ausführen:
- Ganzzahl
- Dezimalzahl
- Doppelt
- Float
- Lang
- Kurz
Weitere Informationen finden Sie in der Richtlinie set-column
.
Sie können numerische Funktionen auf eine oder mehrere Spalten anwenden. Die verfügbaren numerischen Funktionen variieren je nach Anzahl der ausgewählten Spalten. Sie können eine neue Spalte mit den Ergebnissen der Berechnungen erstellen oder die Ergebnisse in der Spalte anzeigen lassen, in der Sie die Transformation hinzufügen.
Wenn Sie eine numerische Funktion auf eine einzelne Spalte anwenden, ist das Verhalten anders als bei der Anwendung einer numerischen Funktion auf mehrere Spalten. Beispiel:
- Wenn Sie die Funktion
Multiply()
auf eine einzelne Spalte anwenden, geben Sie den Dezimalwert an, mit dem jeder Wert in der Spalte multipliziert werden soll. Wrangler führt die Multiplikation mit den Beispieldaten durch und zeigt die neuen Werte in derselben Spalte oder in einer neuen Spalte an. - Wenn Sie die Funktion
Multiply()
auf mehrere Spalten anwenden, multipliziert Wrangler die Werte in jeder Zeile für die ausgewählten Spalten und zeigt die neuen Werte in der ersten Spalte der Transformation an.
Numerische Berechnungen für Werte in einer Spalte ausführen
So wenden Sie eine numerische Berechnung auf eine Spalte an:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten auf den Namen einer Spalte und dann auf den arrow_drop_down-Pfeil zum Maximieren der Spalte.
Wählen Sie Berechnen und dann eine Option aus, z. B. Addieren.
Für einige Funktionen müssen Sie einen Dezimalwert eingeben, um die Berechnung abzuschließen. Wenn Sie beispielsweise Abziehen auswählen, müssen Sie den Wert eingeben, der von jeder Zeile abgezogen werden soll.
Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an.
Klicken Sie auf Übernehmen.
Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende Anweisung als Schritt in das Rezept ein. Wenn Sie beispielsweise von jedem Wert in der Spalte Price
zwei abziehen, fügt Wrangler dem Rezept die folgende Transformation hinzu:
set-column :Price Price - 2
Wenn Sie die Datenpipeline ausführen, wird die Transformation auf alle Werte in der Spalte angewendet.
Unterstützte Berechnungen für eine Spalte
Sie können die folgenden Berechnungen auf alle Werte in einer Spalte anwenden:
Funktion | Beschreibung |
---|---|
Absoluter Wert | Gibt den Absolutwert für jeden Wert in einer Spalte zurück. Der absolute Wert von -10 ist beispielsweise 10. |
Hinzufügen | Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben. |
Arccos | Gibt für jeden Wert in einer Spalte den Kosinus-Inversen zurück. |
Arcsin | Gibt für jeden Wert in einer Spalte den Kehrwert der Sinusfunktion zurück. |
Arctan | Gibt für jeden Wert in einer Spalte den Kehrwert der Tangente zurück. |
Ceil | Gibt die kleinste Ganzzahl zurück, die größer oder gleich dem numerischen Wert in jeder Zelle einer Spalte ist. Wenn der Wert beispielsweise 2, 21 ist, gibt Ceil den Wert 3 zurück. Bei einem Wert von 5, 88 gibt Ceil den Wert 6 zurück. Wenn der Wert -5,15 ist, gibt Ceil den Wert -5 zurück. |
Cos | Gibt den Kosinus jedes Spaltenwerts zurück. |
Cube | Potenziert jeden Wert in der Spalte mit 3. |
Kuben dritter Potenz | Gibt den Kubikwurzelwert jedes Werts in der Spalte zurück. |
Teilung | Teilt jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder teilt jeden Wert in zwei Spalten. |
Etage | Gibt die größte Ganzzahl zurück, die größer oder gleich dem numerischen Wert in jeder Zelle einer Spalte ist. Wenn der Wert beispielsweise 2, 21 ist, gibt FLOOR den Wert 2 zurück. Wenn der Wert 5,88 ist, gibt FLOOR den Wert 5 zurück. Wenn der Wert -5, 15 ist, gibt FLOOR ebenfalls -6 zurück. |
Log | Gibt den Logarithmus jedes Werts in einer Spalte zurück. |
Modulo | Gibt den Rest zurück, der bei der Division jedes Werts in der Spalte durch eine positive Dezimalzahl oder bei der Division jedes Werts in zwei Spalten entsteht. |
Multiplizieren | Multipliziert jeden Wert in der Spalte mit einem positiven oder negativen Dezimalwert oder multipliziert jeden Wert in zwei Spalten. |
Natürlicher Logarithmus | Gibt den natürlichen Logarithmus jedes Werts in einer Spalte zurück. |
Die Macht von | Potenziert den Spaltenwert mit der angegebenen Potenz. |
Zufällig | Generiert zufällige, unvorhersehbare Doppelwerte in einer bestimmten Spalte. |
Runde | Rundet jeden Wert in einer Spalte. |
Sin | Gibt die Sinusfunktion für jeden Wert in einer Spalte zurück. |
Quadrat | Potenziert jeden Wert in der Spalte mit 2. |
Quadratwurzel | Gibt die Quadratwurzel jedes Werts in einer Spalte zurück. |
Abziehen | Von jedem Wert in der Spalte wird eine positive oder negative Dezimalzahl abgezogen. |
Tan | Gibt die Tangente für jeden Wert in einer Spalte zurück. |
Numerische Berechnungen für Werte in zwei Spalten ausführen
So wenden Sie eine numerische Berechnung auf zwei Spalten an:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten die Kästchen neben zwei Spaltennamen an.
- Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
- Wählen Sie Berechnen und dann eine Option aus, z. B. Addieren.
- Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls werden vorhandene Werte durch die berechneten Werte überschrieben.
- Klicken Sie auf Übernehmen.
Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende Anweisung als Schritt in das Rezept ein. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales
und Q2_Sales
addieren und eine neue Spalte namens H1_Sales
erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation aus und erstellt eine neue Spalte namens H1_Sales
mit der Summe von Q1_Sales
und Q2_Sales
.
Unterstützte Berechnungen in zwei Spalten
Sie können in zwei Spalten die folgenden numerischen Berechnungen auf Werte in jeder Zeile anwenden:
Funktion | Beschreibung |
---|---|
Hinzufügen | Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben. |
Durchschnitt | Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück. |
Teilung | Teilt jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder teilt jeden Wert in zwei Spalten. |
Gleich | Boolesche Funktion, die Zeile für Zeile prüft, ob die Werte in zwei Spalten übereinstimmen. Gibt true oder false zurück. |
LCM | Gibt das kleinste gemeinsame Vielfache jeder Zahl in zwei Spalten zurück. |
Max | Gibt den Maximalwert für jede Zeile in zwei Spalten zurück. |
Min. | Gibt den Minimalwert für jede Zeile in zwei Spalten zurück. |
Modulo | Gibt den Rest zurück, der bei der Division jedes Werts in der Spalte durch eine positive Dezimalzahl oder bei der Division jedes Werts in zwei Spalten entsteht. |
Multiplizieren | Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten. |
Abziehen | Von jedem Wert in der Spalte wird eine positive oder negative Dezimalzahl abgezogen. |
Numerische Berechnungen für Werte in drei oder mehr Spalten ausführen
In Cloud Data Fusion Version 6.8.0 und höher werden numerische Berechnungen für Werte in drei oder mehr Spalten unterstützt.
So wenden Sie eine numerische Berechnung auf drei oder mehr Spalten an:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten die Kästchen neben zwei Spaltennamen an.
- Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
- Wählen Sie Berechnen und dann eine Option aus, z. B. Addieren.
- Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls werden vorhandene Werte durch die berechneten Werte überschrieben.
- Klicken Sie auf Übernehmen.
Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende Anweisung als Schritt in das Rezept ein. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales
, Q2_Sales
, Q3_Sales
und Q4_Sales
addieren und eine neue Spalte namens 2022_Sales
erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation aus und erstellt eine neue Spalte namens 2022_Sales
mit der Summe von Q1_Sales
, Q2_Sales
, Q3_Sales
und Q4_Sales
.
Unterstützte Berechnungen in drei oder mehr Spalten
Sie können die folgenden Berechnungen auf Werte in jeder Zeile in drei oder mehr Spalten anwenden:
Funktion | Beschreibung |
---|---|
Hinzufügen | Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben. |
Durchschnitt | Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück. |
Gleich | Boolesche Funktion, die Zeile für Zeile prüft, ob die Werte in zwei Spalten übereinstimmen. Gibt true oder false zurück. |
Max | Gibt den Maximalwert für jede Zeile in zwei Spalten zurück. |
Min. | Gibt den Minimalwert für jede Zeile in zwei Spalten zurück. |
Multiplizieren | Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten. |