Lavorare con i numeri

Questa pagina spiega come eseguire calcoli numerici durante la preparazione dei dati nello spazio di lavoro Wrangler di Cloud Data Fusion Studio.

Puoi eseguire queste trasformazioni nelle colonne dei seguenti tipi di dati:

  • Numero intero
  • Decimale
  • Doppio
  • In virgola mobile
  • Lungo
  • Breve

Per ulteriori informazioni, consulta la direttiva set-column.

Puoi utilizzare le funzioni numeriche su una o più colonne. Le funzioni numeriche disponibili variano in base al numero di colonne selezionate. Puoi scegliere di creare una nuova colonna con i risultati dei calcoli oppure puoi visualizzare i risultati nella colonna in cui aggiungi la trasformazione.

Se applichi una funzione numerica a una singola colonna, il comportamento è diverso rispetto all'applicazione di una funzione numerica a più colonne. Ad esempio:

  • Se utilizzi la funzione Multiply() su una singola colonna, specifica il valore decimale per moltiplicare ogni valore nella colonna. Wrangler esegue la moltiplicazione sui dati di esempio e mostra i nuovi valori nella stessa colonna o in una nuova colonna.
  • Se utilizzi la funzione Multiply() su più colonne, Wrangler moltiplica i valori in ogni riga per le colonne selezionate e mostra i nuovi valori nella prima colonna della trasformazione.

Eseguire calcoli numerici sui valori di una colonna

Per applicare un calcolo numerico a una colonna:

  1. Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, vai a un nome di colonna e fai clic sulla freccia di espansione arrow_drop_down.
  3. Seleziona Calcola e seleziona un'opzione, ad esempio Aggiungi.

    Per completare il calcolo, alcune funzioni richiedono di inserire un valore decimale. Ad esempio, se selezioni Sottrai, devi inserire il valore da sottrare da ogni riga.

  4. (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna.

  5. Fai clic su Applica.

I valori cambiano in base al calcolo. Wrangler aggiunge la direttiva corrispondente come passaggio nella ricetta. Ad esempio, se sottrai 2 da ogni valore della colonna Price, Wrangler aggiunge la seguente trasformazione alla ricetta:

set-column :Price Price - 2

Quando esegui la pipeline di dati, la trasformazione viene applicata a tutti i valori della colonna.

Calcoli supportati per una colonna

Puoi eseguire i seguenti calcoli su tutti i valori di una colonna:

Funzione Descrizione
Valore assoluto Restituisce il valore assoluto di ogni valore in una colonna. Ad esempio, il valore assoluto di -10 è 10.
Aggiungi Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga.
Arccos Restituisce l'arcocoseno di ogni valore in una colonna.
Arcsin Restituisce il seno inverso di ogni valore in una colonna.
Arctan Restituisce l'arcotangente di ogni valore in una colonna.
Ceil Restituisce il numero intero più piccolo maggiore o uguale al valore numerico in ogni cella di una colonna. Ad esempio, se il valore è 2,21, Ceil restituisce 3. Se il valore è 5,88, Ceil restituisce 6. Se il valore è -5,15, Ceil restituisce -5.
Cos Restituisce il coseno di ogni valore di colonna.
Cube Eleviamo ogni valore della colonna alla terza potenza.
Radice cubica Restituisce la radice cubica di ogni valore nella colonna.
Dividi Divide ogni valore nella colonna per un numero decimale positivo o negativo oppure divide ogni valore in due colonne.
Piano Restituisce il numero intero più grande maggiore o uguale al valore numerico in ogni cella di una colonna. Ad esempio, se il valore è 2,21, FLOOR restituisce 2. Se il valore è 5,88, FLOOR restituisce 5. Analogamente, se il valore è -5,15, ARROTONDA.DIFETTO restituisce -6.
Log Restituisce il logaritmo di ogni valore in una colonna.
Modulo Restituisce il resto della divisione di ogni valore della colonna per un numero decimale positivo o il resto della divisione di ogni valore di due colonne.
Moltiplicazione Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne.
Logaritmo naturale Restituisce il logaritmo naturale di ogni valore in una colonna.
Il potere di Eleva il valore della colonna alla potenza specificata del valore.
Casuale Genera valori Double casuali e imprevedibili in una colonna specificata.
Round Arrotonda ogni valore di una colonna.
Senso Restituisce il seno di ogni valore in una colonna.
Quadrato Eleva ogni valore della colonna alla potenza di 2.
Radice quadrata Restituisce la radice quadrata di ogni valore in una colonna.
Sottrazione Sottrae un numero decimale positivo o negativo a ogni valore della colonna.
Marrone chiaro Restituisce la tangente per ogni valore in una colonna.

Eseguire calcoli numerici sui valori di due colonne

Per applicare un calcolo numerico a due colonne:

  1. Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, seleziona la casella di controllo in base a due nomi di colonna.
  3. Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
  4. Seleziona Calcola e seleziona un'opzione, ad esempio Aggiungi.
  5. (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
  6. Fai clic su Applica.

I valori cambiano in base al calcolo. Wrangler aggiunge la direttiva corrispondente come passaggio nella ricetta. Ad esempio, se aggiungi i valori in ogni riga delle colonne Q1_Sales e Q2_Sales e crei una nuova colonna chiamata H1_Sales, Wrangler aggiunge la seguente trasformazione alla ricetta:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea una nuova colonna denominata H1_Sales con il totale di Q1_Sales e Q2_Sales.

Calcoli supportati in due colonne

Puoi eseguire i seguenti calcoli numerici sui valori di ogni riga in due colonne:

Funzione Descrizione
Aggiungi Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga.
Media Restituisce la media di ogni riga in più colonne.
Dividi Divide ogni valore nella colonna per un numero decimale positivo o negativo oppure divide ogni valore in due colonne.
Uguale Funzione booleana che confronta due colonne per verificare se i valori corrispondono, riga per riga. Restituisce true o false.
LCM Restituisce il minimo comune multiplo di ogni numero in due colonne.
Max Restituisce il valore massimo per ogni riga in due colonne.
Min Restituisce il valore minimo per ogni riga in due colonne.
Modulo Restituisce il resto della divisione di ogni valore della colonna per un decimale positivo o il resto della divisione di ogni valore in due colonne.
Moltiplicazione Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne.
Sottrazione Sottrae un numero decimale positivo o negativo a ogni valore della colonna.

Eseguire calcoli numerici sui valori in tre o più colonne

Cloud Data Fusion supporta l'esecuzione di calcoli numerici sui valori di almeno tre colonne nella versione 6.8.0 e successive.

Per applicare un calcolo numerico a tre o più colonne:

  1. Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, seleziona la casella di controllo in base a due nomi di colonna.
  3. Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
  4. Seleziona Calcola e seleziona un'opzione, ad esempio Aggiungi.
  5. (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
  6. Fai clic su Applica.

I valori cambiano in base al calcolo. Wrangler aggiunge la direttiva corrispondente come passaggio nella ricetta. Ad esempio, se aggiungi i valori in ogni riga delle colonne Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales e crei una nuova colonna denominata 2022_Sales, Wrangler aggiunge la seguente trasformazione alla ricetta:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea una nuova colonna denominata 2022_Sales con il totale di Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales.

Calcoli supportati in tre o più colonne

Puoi eseguire i seguenti calcoli sui valori di ogni riga in tre o più colonne:

Funzione Descrizione
Aggiungi Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga.
Media Restituisce la media di ogni riga in più colonne.
Uguale Funzione booleana che confronta due colonne per verificare se i valori corrispondono, riga per riga. Restituisce true o false.
Max Restituisce il valore massimo per ogni riga in due colonne.
Min Restituisce il valore minimo per ogni riga in due colonne.
Moltiplicazione Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne.

Passaggi successivi