Lavorare con i numeri

Questa pagina spiega come eseguire calcoli numerici durante la preparazione dei dati in nell'area di lavoro Wrangler di Cloud Data Fusion Studio.

Puoi eseguire queste trasformazioni nelle colonne dei seguenti tipi di dati:

  • Numero intero
  • Decimale
  • Doppio
  • Numero in virgola mobile
  • Lungo
  • Breve

Per ulteriori informazioni, consulta la direttiva set-column.

Puoi utilizzare le funzioni numeriche su una o più colonne. Le funzioni numeriche disponibili variano in base al numero di colonne selezionate. Puoi scegliere di creare una nuova colonna con i risultati dei calcoli oppure puoi visualizzare i risultati nella colonna in cui aggiungi la trasformazione.

Se applichi una funzione numerica a una singola colonna, il comportamento è diverso rispetto all'applicazione di una funzione numerica a più colonne. Ad esempio:

  • Se utilizzi la funzione Multiply() in una singola colonna, devi specificare la decimale per cui moltiplicare ciascun valore della colonna. Wrangler esegue moltiplicare i dati campione e visualizza i nuovi valori nello stesso colonna o in una nuova colonna.
  • Se utilizzi la funzione Multiply() su più colonne, Wrangler moltiplica i valori in ogni riga per le colonne selezionate e mostra i nuovi valori nella prima colonna della trasformazione.

Eseguire calcoli numerici sui valori di una colonna

Per applicare un calcolo numerico a una colonna:

  1. Vai all'area di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, vai al nome di una colonna e fai clic sull'icona arrow_drop_down freccia di espansione.
  3. Seleziona Calcola e scegli un'opzione, ad esempio Aggiungi.

    Per completare il calcolo, alcune funzioni richiedono di inserire un valore decimale. Ad esempio, se selezioni Sottrai, devi inserire il valore in sottrai da ogni riga.

  4. (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna.

  5. Fai clic su Applica.

I valori cambiano in base al calcolo. Wrangler aggiunge il token come passaggio della formula. Ad esempio, se sottrai 2 da ogni valore della colonna Price, Wrangler aggiunge la seguente trasformazione alla ricetta:

set-column :Price Price - 2

Quando esegui la pipeline di dati, la trasformazione viene applicata a tutti i valori in nella colonna.

Calcoli supportati per una colonna

Puoi eseguire i seguenti calcoli su tutti i valori di una colonna:

Funzione Descrizione
Valore assoluto Restituisce il valore assoluto per ogni valore in una colonna. Ad esempio, il valore assoluto di -10 è 10.
Aggiungi Aggiunge un numero decimale positivo o negativo in una colonna oppure ne aggiunge più colonne per restituire la somma di ogni riga.
Arccos Restituisce l'arcocoseno di ogni valore in una colonna.
Arcsin Restituisce l'inverso di sin per ogni valore in una colonna.
Arctan Restituisce l'arcotangente di ogni valore in una colonna.
Ceil Restituisce il numero intero più piccolo maggiore di o uguale al numero in ogni cella di una colonna. Ad esempio, se il valore è 2,21, Ceil restituisce 3. Se il valore è 5,88, Ceil restituisce 6. Se il valore è -5,15, Ceil restituisce -5.
Cos Restituisce il coseno del valore di ogni colonna.
Cube Eleva ogni valore della colonna alla terza potenza.
Radice cubica Restituisce la radice cubica di ogni valore nella colonna.
Dividi Divide ogni valore nella colonna per un numero decimale positivo o negativo o suddivide ogni valore in due colonne.
Piano Restituisce il numero intero più grande maggiore o uguale al valore numerico in ogni cella di una colonna. Ad esempio, se il valore è 2,21, FLOOR restituisce 2. Se il valore è 5,88, FLOOR restituisce 5. Allo stesso modo, se il valore è -5,15, FLOOR restituisce -6.
Registra Restituisce il logaritmo di ciascun valore in una colonna.
Modulo Restituisce il resto della divisione di ogni valore della colonna per un numero decimale positivo o il resto della divisione di ogni valore di due colonne.
Moltiplicazione Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne.
Logaritmo naturale Restituisce il logaritmo naturale di ciascun valore in una colonna.
Potere di Eleva il valore della colonna alla potenza specificata del valore.
Casuale Genera valori Doppi casuali e imprevedibili in un colonna.
Round Arrotonda ogni valore di una colonna.
peccato Restituisce il seno di ogni valore in una colonna.
Quadrato Eleva ogni valore della colonna alla potenza di 2.
Radice quadrata Restituisce la radice quadrata di ogni valore in una colonna.
Sottrai Sottrae un numero decimale positivo o negativo per ogni valore all'interno di colonna.
Marrone Restituisce la tangente per ogni valore in una colonna.

Eseguire calcoli numerici su valori in due colonne

Per applicare un calcolo numerico a due colonne:

  1. Vai all'area di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, seleziona la casella di controllo in base ai due nomi di colonna.
  3. Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
  4. Seleziona Calcola e scegli un'opzione, ad esempio Aggiungi.
  5. (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
  6. Fai clic su Applica.

I valori cambiano in base al calcolo. Wrangler aggiunge il token come passaggio della formula. Ad esempio, se aggiungi i valori in ogni riga delle colonne Q1_Sales e Q2_Sales e crea una nuova colonna denominata H1_Sales, Wrangler aggiunge la seguente trasformazione alla formula:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea una nuova colonna denominata H1_Sales con un totale di Q1_Sales e Q2_Sales.

Calcoli supportati in due colonne

Puoi eseguire i seguenti calcoli numerici sui valori di ogni riga in due colonne:

Funzione Descrizione
Aggiungi Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga.
Media Restituisce la media di ogni riga in più colonne.
Dividi Divide ogni valore nella colonna per un decimale positivo o negativo oppure Divide ogni valore in due colonne.
Uguale Funzione booleana che confronta due colonne per vedere se i valori corrispondono, riga per riga. Restituisce true o false.
M.M.M. Restituisce il minimo comune multiplo di ogni numero in due colonne.
Max Restituisce il valore massimo per ogni riga in due colonne.
Min Restituisce il valore minimo per ogni riga in due colonne.
Modulo Restituisce il resto quando dividi ogni valore nella colonna per una decimale positivo o restituisce il resto quando si divide ciascun valore in due colonne.
Moltiplica Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne.
Sottrazione Sottrae un numero decimale positivo o negativo per ogni valore all'interno di colonna.

Eseguire calcoli numerici su valori di tre o più colonne

Cloud Data Fusion supporta l'esecuzione di calcoli numerici sui valori di almeno tre colonne nella versione 6.8.0 e successive.

Per applicare un calcolo numerico a tre o più colonne:

  1. Vai all'area di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, seleziona la casella di controllo in base ai due nomi di colonna.
  3. Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
  4. Seleziona Calcola e scegli un'opzione, ad esempio Aggiungi.
  5. (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
  6. Fai clic su Applica.

I valori cambiano in base al calcolo. Wrangler aggiunge il token come passaggio della formula. Ad esempio, se aggiungi i valori in ogni riga delle colonne Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales e crei una nuova colonna denominata 2022_Sales, Wrangler aggiunge la seguente trasformazione alla ricetta:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea una nuova colonna denominata 2022_Sales con un totale di Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales.

Calcoli supportati in tre o più colonne

Puoi eseguire i seguenti calcoli sui valori di ogni riga in tre o più colonne:

Funzione Descrizione
Aggiungi Aggiunge un numero decimale positivo o negativo a una colonna oppure più colonne per restituire la somma di ogni riga.
Media Restituisce la media di ogni riga in più colonne.
Uguale Funzione booleana che confronta due colonne per verificare se i valori corrispondono, riga per riga. Restituisce true o false.
Max Restituisce il valore massimo per ogni riga in due colonne.
Min Restituisce il valore minimo per ogni riga in due colonne.
Moltiplica Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne.

Passaggi successivi