Questa pagina spiega come eseguire calcoli numerici durante la preparazione dei dati nello spazio di lavoro Wrangler di Cloud Data Fusion Studio.
Puoi eseguire queste trasformazioni nelle colonne dei seguenti tipi di dati:
- Numero intero
- Decimale
- Doppio
- In virgola mobile
- Lungo
- Breve
Per ulteriori informazioni, consulta la direttiva set-column
.
Puoi utilizzare le funzioni numeriche su una o più colonne. Le funzioni numeriche disponibili variano in base al numero di colonne selezionate. Puoi scegliere di creare una nuova colonna con i risultati dei calcoli oppure puoi visualizzare i risultati nella colonna in cui aggiungi la trasformazione.
Se applichi una funzione numerica a una singola colonna, il comportamento è diverso rispetto all'applicazione di una funzione numerica a più colonne. Ad esempio:
- Se utilizzi la funzione
Multiply()
su una singola colonna, specifica il valore decimale per moltiplicare ogni valore nella colonna. Wrangler esegue la moltiplicazione sui dati di esempio e mostra i nuovi valori nella stessa colonna o in una nuova colonna. - Se utilizzi la funzione
Multiply()
su più colonne, Wrangler moltiplica i valori in ogni riga per le colonne selezionate e mostra i nuovi valori nella prima colonna della trasformazione.
Eseguire calcoli numerici sui valori di una colonna
Per applicare un calcolo numerico a una colonna:
- Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
- Nella scheda Dati, vai a un nome di colonna e fai clic sulla freccia di espansione arrow_drop_down.
Seleziona Calcola e seleziona un'opzione, ad esempio Aggiungi.
Per completare il calcolo, alcune funzioni richiedono di inserire un valore decimale. Ad esempio, se selezioni Sottrai, devi inserire il valore da sottrare da ogni riga.
(Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna.
Fai clic su Applica.
I valori cambiano in base al calcolo. Wrangler aggiunge la direttiva corrispondente come passaggio nella ricetta. Ad esempio, se sottrai 2 da ogni valore della colonna Price
, Wrangler aggiunge la seguente trasformazione alla ricetta:
set-column :Price Price - 2
Quando esegui la pipeline di dati, la trasformazione viene applicata a tutti i valori della colonna.
Calcoli supportati per una colonna
Puoi eseguire i seguenti calcoli su tutti i valori di una colonna:
Funzione | Descrizione |
---|---|
Valore assoluto | Restituisce il valore assoluto di ogni valore in una colonna. Ad esempio, il valore assoluto di -10 è 10. |
Aggiungi | Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga. |
Arccos | Restituisce l'arcocoseno di ogni valore in una colonna. |
Arcsin | Restituisce il seno inverso di ogni valore in una colonna. |
Arctan | Restituisce l'arcotangente di ogni valore in una colonna. |
Ceil | Restituisce il numero intero più piccolo maggiore o uguale al valore numerico in ogni cella di una colonna. Ad esempio, se il valore è 2,21, Ceil restituisce 3. Se il valore è 5,88, Ceil restituisce 6. Se il valore è -5,15, Ceil restituisce -5. |
Cos | Restituisce il coseno di ogni valore di colonna. |
Cube | Eleviamo ogni valore della colonna alla terza potenza. |
Radice cubica | Restituisce la radice cubica di ogni valore nella colonna. |
Dividi | Divide ogni valore nella colonna per un numero decimale positivo o negativo oppure divide ogni valore in due colonne. |
Piano | Restituisce il numero intero più grande maggiore o uguale al valore numerico in ogni cella di una colonna. Ad esempio, se il valore è 2,21, FLOOR restituisce 2. Se il valore è 5,88, FLOOR restituisce 5. Analogamente, se il valore è -5,15, ARROTONDA.DIFETTO restituisce -6. |
Log | Restituisce il logaritmo di ogni valore in una colonna. |
Modulo | Restituisce il resto della divisione di ogni valore della colonna per un numero decimale positivo o il resto della divisione di ogni valore di due colonne. |
Moltiplicazione | Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne. |
Logaritmo naturale | Restituisce il logaritmo naturale di ogni valore in una colonna. |
Il potere di | Eleva il valore della colonna alla potenza specificata del valore. |
Casuale | Genera valori Double casuali e imprevedibili in una colonna specificata. |
Round | Arrotonda ogni valore di una colonna. |
Senso | Restituisce il seno di ogni valore in una colonna. |
Quadrato | Eleva ogni valore della colonna alla potenza di 2. |
Radice quadrata | Restituisce la radice quadrata di ogni valore in una colonna. |
Sottrazione | Sottrae un numero decimale positivo o negativo a ogni valore della colonna. |
Marrone chiaro | Restituisce la tangente per ogni valore in una colonna. |
Eseguire calcoli numerici sui valori di due colonne
Per applicare un calcolo numerico a due colonne:
- Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
- Nella scheda Dati, seleziona la casella di controllo in base a due nomi di colonna.
- Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
- Seleziona Calcola e seleziona un'opzione, ad esempio Aggiungi.
- (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
- Fai clic su Applica.
I valori cambiano in base al calcolo. Wrangler aggiunge la direttiva corrispondente come passaggio nella ricetta. Ad esempio, se aggiungi i valori in ogni riga
delle colonne Q1_Sales
e Q2_Sales
e crei una nuova colonna chiamata
H1_Sales
, Wrangler aggiunge la seguente trasformazione alla ricetta:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea
una nuova colonna denominata H1_Sales
con il totale di Q1_Sales
e Q2_Sales
.
Calcoli supportati in due colonne
Puoi eseguire i seguenti calcoli numerici sui valori di ogni riga in due colonne:
Funzione | Descrizione |
---|---|
Aggiungi | Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga. |
Media | Restituisce la media di ogni riga in più colonne. |
Dividi | Divide ogni valore nella colonna per un numero decimale positivo o negativo oppure divide ogni valore in due colonne. |
Uguale | Funzione booleana che confronta due colonne per verificare se i valori corrispondono, riga
per riga. Restituisce true o false . |
LCM | Restituisce il minimo comune multiplo di ogni numero in due colonne. |
Max | Restituisce il valore massimo per ogni riga in due colonne. |
Min | Restituisce il valore minimo per ogni riga in due colonne. |
Modulo | Restituisce il resto della divisione di ogni valore della colonna per un decimale positivo o il resto della divisione di ogni valore in due colonne. |
Moltiplicazione | Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne. |
Sottrazione | Sottrae un numero decimale positivo o negativo a ogni valore della colonna. |
Eseguire calcoli numerici sui valori in tre o più colonne
Cloud Data Fusion supporta l'esecuzione di calcoli numerici sui valori di almeno tre colonne nella versione 6.8.0 e successive.
Per applicare un calcolo numerico a tre o più colonne:
- Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
- Nella scheda Dati, seleziona la casella di controllo in base a due nomi di colonna.
- Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
- Seleziona Calcola e seleziona un'opzione, ad esempio Aggiungi.
- (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
- Fai clic su Applica.
I valori cambiano in base al calcolo. Wrangler aggiunge la direttiva corrispondente come passaggio nella ricetta. Ad esempio, se aggiungi i valori in ogni riga
delle colonne Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
e crei una
nuova colonna denominata 2022_Sales
, Wrangler aggiunge la seguente trasformazione alla
ricetta:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea una nuova colonna denominata 2022_Sales
con il totale di Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
.
Calcoli supportati in tre o più colonne
Puoi eseguire i seguenti calcoli sui valori di ogni riga in tre o più colonne:
Funzione | Descrizione |
---|---|
Aggiungi | Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga. |
Media | Restituisce la media di ogni riga in più colonne. |
Uguale | Funzione booleana che confronta due colonne per verificare se i valori corrispondono, riga
per riga. Restituisce true o false . |
Max | Restituisce il valore massimo per ogni riga in due colonne. |
Min | Restituisce il valore minimo per ogni riga in due colonne. |
Moltiplicazione | Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne. |
Passaggi successivi
- Scopri di più sulle istruzioni di Wrangler.