Auf dieser Seite wird erläutert, wie Sie numerische Berechnungen ausführen, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.
Sie können diese Transformationen in Spalten der folgenden Datentypen ausführen:
- Ganzzahl
- Dezimal
- Doppelt
- Float
- Long
- Kurz
Weitere Informationen finden Sie in der set-column
-Anweisung.
Sie können numerische Funktionen auf eine oder mehrere Spalten anwenden. Die verfügbaren numerischen variieren je nach Anzahl der ausgewählten Spalten. Sie können eine neue Spalte mit den Ergebnissen der Berechnungen erstellen. Alternativ können Sie werden in der Spalte angezeigt, in der Sie die Transformation hinzufügen.
Wenn Sie einen numerischen Wert auf eine einzelne Spalte anwenden, unterscheidet sich das Verhalten von der Anwendung einer in mehrere Spalten verschieben. Beispiel:
- Wenn Sie die
Multiply()
-Funktion auf eine einzelne Spalte anwenden, geben Sie die Dezimalwert, mit dem jeder Wert in der Spalte multipliziert wird. Wrangler führt die Multiplikation mit den Beispieldaten durch und zeigt die neuen Werte in derselben Spalte oder in einer neuen Spalte an. - Wenn Sie die Funktion
Multiply()
auf mehrere Spalten anwenden, multipliziert Wrangler die Werte in jeder Zeile für die ausgewählten Spalten und zeigt die neuen Werte in der ersten Spalte der Transformation an.
Numerische Berechnungen für Werte in einer Spalte durchführen
So wenden Sie eine numerische Berechnung auf eine Spalte an:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten zu einem Spaltennamen arrow_drop_down Erweiterungspfeil.
Klicken Sie auf Berechnen und wählen Sie eine Option aus, z. B. Hinzufügen.
Bei einigen Funktionen müssen Sie eine Dezimalzahl eingeben, um die Berechnung abzuschließen. Wert. Wenn Sie beispielsweise Abziehen auswählen, müssen Sie den Wert eingeben, der von jeder Zeile abgezogen werden soll.
Optional: Um eine neue Spalte für die berechneten Werte zu erstellen, wählen Sie das In eine neue Spalte kopieren.
Klicken Sie auf Anwenden.
Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende
als Schritt im Schema. Wenn Sie zum Beispiel jeweils 2 subtrahieren
Wert in der Spalte Price
hat, fügt Wrangler die folgende Transformation zum
Rezept:
set-column :Price Price - 2
Wenn Sie die Datenpipeline ausführen, wird die Transformation auf alle Werte in der Spalte angewendet.
Unterstützte Berechnungen für eine Spalte
Sie können die folgenden Berechnungen für alle Werte in einer Spalte durchführen:
Funktion | Beschreibung |
---|---|
Absoluter Wert | Gibt den absoluten Wert für jeden Wert in einer Spalte zurück. Der absolute Wert von -10 ist beispielsweise 10. |
Hinzufügen | Fügt einer Spalte eine positive oder negative Dezimalzahl hinzu oder fügt mehrere Spalten, um die Summe jeder Zeile auszugeben. |
Arccos | Gibt die Umkehrfunktion des Kosinus für jeden Wert in einer Spalte zurück. |
Bärchen | Gibt den Kehrwert von sin für jeden Wert in einer Spalte zurück. |
Arktis | Gibt für jeden Wert in einer Spalte den Kehrwert der Tangente zurück. |
Decke | Gibt die kleinste Ganzzahl zurück, die größer oder gleich der numerischen in jeder Zelle einer Spalte einen Wert eingeben. Wenn der Wert beispielsweise 2,21 ist, gibt Ceil den Wert 3 zurück. Bei einem Wert von 5, 88 gibt die Ceil-Wert 6 zurück. Wenn der Wert -5,15, gibt Ceil -5 zurück. |
Cos | Gibt den Kosinus jedes Spaltenwerts zurück. |
Würfel | Erhöht jeden Wert in der Spalte auf die Potenz von 3. |
Kubewurzel | Gibt den Kubikwurzelwert jedes Werts in der Spalte zurück. |
Teilen | Teilt jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder teilt jeden Wert in zwei Spalten. |
Etage | Gibt die größte Ganzzahl zurück, die größer oder gleich dem numerischen Wert ist in jeder Zelle einer Spalte. Wenn der Wert beispielsweise 2, 21 ist, gibt FLOOR gibt 2 zurück. Bei einem Wert von 5, 88 gibt FLOOR 5 zurück. Wenn der Wert ist -5,15, FLOOR gibt -6 zurück. |
Log | Gibt den Logarithmus jedes Werts in einer Spalte zurück. |
Modulo | Gibt den Rest zurück, wenn jeder Wert in der Spalte durch a geteilt wird positive Dezimalzahl oder gibt den Rest zurück, wenn jeder Wert in zwei Spalten. |
Multiplizieren | Jeder Wert in der Spalte wird mit einer positiven oder negativen Dezimalzahl multipliziert. oder multipliziert jeden Wert in zwei Spalten. |
Natürliches Log | Gibt den natürlichen Logarithmus jedes Werts in einer Spalte zurück. |
Potenzial von | Setzt den Spaltenwert auf die angegebene Potenz des Werts. |
Zufällig | Generiert zufällige, unvorhersehbare Double-Werte in einer angegebenen Spalte. |
Runde | Rundet jeden Wert in einer Spalte. |
Sin | Gibt den Sin für jeden Wert in einer Spalte zurück. |
Quadratformat | Erhöht jeden Wert in der Spalte auf die Potenz von 2. |
Quadratwurzel | Gibt die Quadratwurzel jedes Werts in einer Spalte zurück. |
Subtrahieren | Subtrahiert eine positive oder negative Dezimalzahl von jedem Wert im Spalte. |
Hellbraun | Gibt die Tangente für jeden Wert in einer Spalte zurück. |
Numerische Berechnungen für Werte in zwei Spalten ausführen
So wenden Sie eine numerische Berechnung auf zwei Spalten an:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten das Kästchen neben zwei Spaltennamen an.
- Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
- Klicken Sie auf Berechnen und wählen Sie eine Option aus, z. B. Hinzufügen.
- Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls überschreiben die berechneten Werte vorhandenen Werten.
- Klicken Sie auf Anwenden.
Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende
als Schritt im Schema. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales
und Q2_Sales
addieren und eine neue Spalte namens H1_Sales
erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation durch und erstellt
eine neue Spalte namens H1_Sales
mit der Gesamtsumme von Q1_Sales
und Q2_Sales
.
Unterstützte Berechnungen in zwei Spalten
Sie können die folgenden numerischen Berechnungen für Werte in jeder Zeile in zwei Spalten:
Funktion | Beschreibung |
---|---|
Hinzufügen | Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben. |
Durchschnitt | Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück. |
Teilen | Dividiert jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder dividiert jeden Wert in zwei Spalten. |
Gleich | Boolesche Funktion, die Zeile für Zeile prüft, ob die Werte in zwei Spalten übereinstimmen. Gibt true oder false zurück. |
LCM-Richtlinie | Gibt das kleinste gemeinsame Vielfache jeder Zahl in zwei Spalten zurück. |
Max | Gibt den Maximalwert für jede Zeile in zwei Spalten zurück. |
Min. | Gibt den Minimalwert für jede Zeile in zwei Spalten zurück. |
Modulo | Gibt den Rest zurück, wenn jeder Wert in der Spalte durch a geteilt wird positive Dezimalzahl oder gibt den Rest zurück, wenn jeder Wert durch zwei geteilt wird Spalten. |
Multiplizieren | Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten. |
Subtrahieren | Subtrahiert eine positive oder negative Dezimalzahl von jedem Wert im Spalte. |
Numerische Berechnungen für Werte in drei oder mehr Spalten ausführen
Cloud Data Fusion unterstützt die Durchführung numerischer Berechnungen für Werte in mindestens drei Spalten in Version 6.8.0 und höher.
So wenden Sie eine numerische Berechnung auf drei oder mehr Spalten an:
- Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
- Klicken Sie auf dem Tab Daten das Kästchen neben zwei Spaltennamen an.
- Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
- Klicken Sie auf Berechnen und wählen Sie eine Option aus, z. B. Hinzufügen.
- Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls überschreiben die berechneten Werte vorhandenen Werten.
- Klicken Sie auf Anwenden.
Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende
als Schritt im Schema. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales
, Q2_Sales
, Q3_Sales
und Q4_Sales
addieren und eine neue Spalte namens 2022_Sales
erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation durch und erstellt
eine neue Spalte namens 2022_Sales
mit der Summe von Q1_Sales
, Q2_Sales
,
Q3_Sales
und Q4_Sales
.
Unterstützte Berechnungen in drei oder mehr Spalten
Sie können die folgenden Berechnungen für Werte in jeder Zeile in drei oder weitere Spalten:
Funktion | Beschreibung |
---|---|
Hinzufügen | Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben. |
Durchschnitt | Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück. |
Gleich | Boolesche Funktion, die zwei Spalten vergleicht, um festzustellen, ob Werte übereinstimmen, Zeile
nach Zeile sortiert. Gibt true oder false zurück. |
Max. | Gibt den Maximalwert für jede Zeile in zwei Spalten zurück. |
Min. | Gibt den Minimalwert für jede Zeile in zwei Spalten zurück. |
Multiplizieren | Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten. |