Mit Zahlen arbeiten

Auf dieser Seite wird erläutert, wie Sie numerische Berechnungen ausführen, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.

Sie können diese Transformationen in Spalten mit den folgenden Datentypen ausführen:

  • Ganzzahl
  • Dezimalzahl
  • Doppelt
  • Float
  • Lang
  • Kurz

Weitere Informationen finden Sie in der Richtlinie set-column.

Sie können numerische Funktionen auf eine oder mehrere Spalten anwenden. Die verfügbaren numerischen Funktionen variieren je nach Anzahl der ausgewählten Spalten. Sie können eine neue Spalte mit den Ergebnissen der Berechnungen erstellen oder die Ergebnisse in der Spalte anzeigen lassen, in der Sie die Transformation hinzufügen.

Wenn Sie eine numerische Funktion auf eine einzelne Spalte anwenden, ist das Verhalten anders als bei der Anwendung einer numerischen Funktion auf mehrere Spalten. Beispiel:

  • Wenn Sie die Funktion Multiply() auf eine einzelne Spalte anwenden, geben Sie den Dezimalwert an, mit dem jeder Wert in der Spalte multipliziert werden soll. Wrangler führt die Multiplikation mit den Beispieldaten durch und zeigt die neuen Werte in derselben Spalte oder in einer neuen Spalte an.
  • Wenn Sie die Funktion Multiply() auf mehrere Spalten anwenden, multipliziert Wrangler die Werte in jeder Zeile für die ausgewählten Spalten und zeigt die neuen Werte in der ersten Spalte der Transformation an.

Numerische Berechnungen für Werte in einer Spalte ausführen

So wenden Sie eine numerische Berechnung auf eine Spalte an:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten auf den Namen einer Spalte und dann auf den arrow_drop_down-Pfeil zum Maximieren der Spalte.
  3. Wählen Sie Berechnen und dann eine Option aus, z. B. Addieren.

    Für einige Funktionen müssen Sie einen Dezimalwert eingeben, um die Berechnung abzuschließen. Wenn Sie beispielsweise Abziehen auswählen, müssen Sie den Wert eingeben, der von jeder Zeile abgezogen werden soll.

  4. Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an.

  5. Klicken Sie auf Übernehmen.

Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende Anweisung als Schritt in das Rezept ein. Wenn Sie beispielsweise von jedem Wert in der Spalte Price zwei abziehen, fügt Wrangler dem Rezept die folgende Transformation hinzu:

set-column :Price Price - 2

Wenn Sie die Datenpipeline ausführen, wird die Transformation auf alle Werte in der Spalte angewendet.

Unterstützte Berechnungen für eine Spalte

Sie können die folgenden Berechnungen auf alle Werte in einer Spalte anwenden:

Funktion Beschreibung
Absoluter Wert Gibt den Absolutwert für jeden Wert in einer Spalte zurück. Der absolute Wert von -10 ist beispielsweise 10.
Hinzufügen Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben.
Arccos Gibt für jeden Wert in einer Spalte den Kosinus-Inversen zurück.
Arcsin Gibt für jeden Wert in einer Spalte den Kehrwert der Sinusfunktion zurück.
Arctan Gibt für jeden Wert in einer Spalte den Kehrwert der Tangente zurück.
Ceil Gibt die kleinste Ganzzahl zurück, die größer oder gleich dem numerischen Wert in jeder Zelle einer Spalte ist. Wenn der Wert beispielsweise 2, 21 ist, gibt Ceil den Wert 3 zurück. Bei einem Wert von 5, 88 gibt Ceil den Wert 6 zurück. Wenn der Wert -5,15 ist, gibt Ceil den Wert -5 zurück.
Cos Gibt den Kosinus jedes Spaltenwerts zurück.
Cube Potenziert jeden Wert in der Spalte mit 3.
Kuben dritter Potenz Gibt den Kubikwurzelwert jedes Werts in der Spalte zurück.
Teilung Teilt jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder teilt jeden Wert in zwei Spalten.
Etage Gibt die größte Ganzzahl zurück, die größer oder gleich dem numerischen Wert in jeder Zelle einer Spalte ist. Wenn der Wert beispielsweise 2, 21 ist, gibt FLOOR den Wert 2 zurück. Wenn der Wert 5,88 ist, gibt FLOOR den Wert 5 zurück. Wenn der Wert -5, 15 ist, gibt FLOOR ebenfalls -6 zurück.
Log Gibt den Logarithmus jedes Werts in einer Spalte zurück.
Modulo Gibt den Rest zurück, der bei der Division jedes Werts in der Spalte durch eine positive Dezimalzahl oder bei der Division jedes Werts in zwei Spalten entsteht.
Multiplizieren Multipliziert jeden Wert in der Spalte mit einem positiven oder negativen Dezimalwert oder multipliziert jeden Wert in zwei Spalten.
Natürlicher Logarithmus Gibt den natürlichen Logarithmus jedes Werts in einer Spalte zurück.
Die Macht von Potenziert den Spaltenwert mit der angegebenen Potenz.
Zufällig Generiert zufällige, unvorhersehbare Doppelwerte in einer bestimmten Spalte.
Runde Rundet jeden Wert in einer Spalte.
Sin Gibt die Sinusfunktion für jeden Wert in einer Spalte zurück.
Quadrat Potenziert jeden Wert in der Spalte mit 2.
Quadratwurzel Gibt die Quadratwurzel jedes Werts in einer Spalte zurück.
Abziehen Von jedem Wert in der Spalte wird eine positive oder negative Dezimalzahl abgezogen.
Tan Gibt die Tangente für jeden Wert in einer Spalte zurück.

Numerische Berechnungen für Werte in zwei Spalten ausführen

So wenden Sie eine numerische Berechnung auf zwei Spalten an:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten die Kästchen neben zwei Spaltennamen an.
  3. Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
  4. Wählen Sie Berechnen und dann eine Option aus, z. B. Addieren.
  5. Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls werden vorhandene Werte durch die berechneten Werte überschrieben.
  6. Klicken Sie auf Übernehmen.

Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende Anweisung als Schritt in das Rezept ein. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales und Q2_Sales addieren und eine neue Spalte namens H1_Sales erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation aus und erstellt eine neue Spalte namens H1_Sales mit der Summe von Q1_Sales und Q2_Sales.

Unterstützte Berechnungen in zwei Spalten

Sie können in zwei Spalten die folgenden numerischen Berechnungen auf Werte in jeder Zeile anwenden:

Funktion Beschreibung
Hinzufügen Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben.
Durchschnitt Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück.
Teilung Teilt jeden Wert in der Spalte durch eine positive oder negative Dezimalzahl oder teilt jeden Wert in zwei Spalten.
Gleich Boolesche Funktion, die Zeile für Zeile prüft, ob die Werte in zwei Spalten übereinstimmen. Gibt true oder false zurück.
LCM Gibt das kleinste gemeinsame Vielfache jeder Zahl in zwei Spalten zurück.
Max Gibt den Maximalwert für jede Zeile in zwei Spalten zurück.
Min. Gibt den Minimalwert für jede Zeile in zwei Spalten zurück.
Modulo Gibt den Rest zurück, der bei der Division jedes Werts in der Spalte durch eine positive Dezimalzahl oder bei der Division jedes Werts in zwei Spalten entsteht.
Multiplizieren Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten.
Abziehen Von jedem Wert in der Spalte wird eine positive oder negative Dezimalzahl abgezogen.

Numerische Berechnungen für Werte in drei oder mehr Spalten ausführen

In Cloud Data Fusion Version 6.8.0 und höher werden numerische Berechnungen für Werte in drei oder mehr Spalten unterstützt.

So wenden Sie eine numerische Berechnung auf drei oder mehr Spalten an:

  1. Rufen Sie den Wrangler-Arbeitsbereich in Cloud Data Fusion auf.
  2. Klicken Sie auf dem Tab Daten die Kästchen neben zwei Spaltennamen an.
  3. Klicken Sie auf einen Spaltennamen und dann auf den arrow_drop_down-Erweiterungspfeil.
  4. Wählen Sie Berechnen und dann eine Option aus, z. B. Addieren.
  5. Optional: Wenn Sie eine neue Spalte für die berechneten Werte erstellen möchten, klicken Sie das Kästchen In eine neue Spalte kopieren an. Andernfalls werden vorhandene Werte durch die berechneten Werte überschrieben.
  6. Klicken Sie auf Übernehmen.

Die Werte ändern sich je nach Berechnung. Wrangler fügt die entsprechende Anweisung als Schritt in das Rezept ein. Wenn Sie beispielsweise die Werte in jeder Zeile der Spalten Q1_Sales, Q2_Sales, Q3_Sales und Q4_Sales addieren und eine neue Spalte namens 2022_Sales erstellen, fügt Wrangler dem Rezept die folgende Transformation hinzu:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Wenn Sie die Datenpipeline ausführen, führt Wrangler die Transformation aus und erstellt eine neue Spalte namens 2022_Sales mit der Summe von Q1_Sales, Q2_Sales, Q3_Sales und Q4_Sales.

Unterstützte Berechnungen in drei oder mehr Spalten

Sie können die folgenden Berechnungen auf Werte in jeder Zeile in drei oder mehr Spalten anwenden:

Funktion Beschreibung
Hinzufügen Fügen Sie einer Spalte eine positive oder negative Dezimalzahl oder mehrere Spalten hinzu, um die Summe der einzelnen Zeilen auszugeben.
Durchschnitt Gibt den Durchschnitt jeder Zeile in mehreren Spalten zurück.
Gleich Boolesche Funktion, die Zeile für Zeile prüft, ob die Werte in zwei Spalten übereinstimmen. Gibt true oder false zurück.
Max Gibt den Maximalwert für jede Zeile in zwei Spalten zurück.
Min. Gibt den Minimalwert für jede Zeile in zwei Spalten zurück.
Multiplizieren Multipliziert jeden Wert in der Spalte mit einer positiven oder negativen Dezimalzahl oder multipliziert jeden Wert in zwei Spalten.

Nächste Schritte