Questa pagina spiega come eseguire calcoli numerici durante la preparazione dei dati in nell'area di lavoro Wrangler di Cloud Data Fusion Studio.
Puoi eseguire queste trasformazioni nelle colonne dei seguenti tipi di dati:
- Numero intero
- Decimale
- Doppio
- Numero in virgola mobile
- Lungo
- Breve
Per ulteriori informazioni, consulta la direttiva set-column
.
Puoi utilizzare le funzioni numeriche su una o più colonne. Le funzioni numeriche disponibili variano in base al numero di colonne selezionate. Puoi scegliere di creare una nuova colonna con i risultati dei calcoli oppure puoi visualizzare i risultati nella colonna in cui aggiungi la trasformazione.
Se applichi una funzione numerica a una singola colonna, il comportamento è diverso rispetto all'applicazione di una funzione numerica a più colonne. Ad esempio:
- Se utilizzi la funzione
Multiply()
in una singola colonna, devi specificare la decimale per cui moltiplicare ciascun valore della colonna. Wrangler esegue moltiplicare i dati campione e visualizza i nuovi valori nello stesso colonna o in una nuova colonna. - Se utilizzi la funzione
Multiply()
su più colonne, Wrangler moltiplica i valori in ogni riga per le colonne selezionate e mostra i nuovi valori nella prima colonna della trasformazione.
Eseguire calcoli numerici sui valori di una colonna
Per applicare un calcolo numerico a una colonna:
- Vai all'area di lavoro Wrangler in Cloud Data Fusion.
- Nella scheda Dati, vai al nome di una colonna e fai clic sull'icona arrow_drop_down freccia di espansione.
Seleziona Calcola e scegli un'opzione, ad esempio Aggiungi.
Per completare il calcolo, alcune funzioni richiedono di inserire un valore decimale. Ad esempio, se selezioni Sottrai, devi inserire il valore in sottrai da ogni riga.
(Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna.
Fai clic su Applica.
I valori cambiano in base al calcolo. Wrangler aggiunge il token
come passaggio della formula. Ad esempio, se sottrai 2 da ogni valore della colonna Price
, Wrangler aggiunge la seguente trasformazione alla ricetta:
set-column :Price Price - 2
Quando esegui la pipeline di dati, la trasformazione viene applicata a tutti i valori in nella colonna.
Calcoli supportati per una colonna
Puoi eseguire i seguenti calcoli su tutti i valori di una colonna:
Funzione | Descrizione |
---|---|
Valore assoluto | Restituisce il valore assoluto per ogni valore in una colonna. Ad esempio, il valore assoluto di -10 è 10. |
Aggiungi | Aggiunge un numero decimale positivo o negativo in una colonna oppure ne aggiunge più colonne per restituire la somma di ogni riga. |
Arccos | Restituisce l'arcocoseno di ogni valore in una colonna. |
Arcsin | Restituisce l'inverso di sin per ogni valore in una colonna. |
Arctan | Restituisce l'arcotangente di ogni valore in una colonna. |
Ceil | Restituisce il numero intero più piccolo maggiore di o uguale al numero in ogni cella di una colonna. Ad esempio, se il valore è 2,21, Ceil restituisce 3. Se il valore è 5,88, Ceil restituisce 6. Se il valore è -5,15, Ceil restituisce -5. |
Cos | Restituisce il coseno del valore di ogni colonna. |
Cube | Eleva ogni valore della colonna alla terza potenza. |
Radice cubica | Restituisce la radice cubica di ogni valore nella colonna. |
Dividi | Divide ogni valore nella colonna per un numero decimale positivo o negativo o suddivide ogni valore in due colonne. |
Piano | Restituisce il numero intero più grande maggiore o uguale al valore numerico in ogni cella di una colonna. Ad esempio, se il valore è 2,21, FLOOR restituisce 2. Se il valore è 5,88, FLOOR restituisce 5. Allo stesso modo, se il valore è -5,15, FLOOR restituisce -6. |
Registra | Restituisce il logaritmo di ciascun valore in una colonna. |
Modulo | Restituisce il resto della divisione di ogni valore della colonna per un numero decimale positivo o il resto della divisione di ogni valore di due colonne. |
Moltiplicazione | Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne. |
Logaritmo naturale | Restituisce il logaritmo naturale di ciascun valore in una colonna. |
Potere di | Eleva il valore della colonna alla potenza specificata del valore. |
Casuale | Genera valori Doppi casuali e imprevedibili in un colonna. |
Round | Arrotonda ogni valore di una colonna. |
peccato | Restituisce il seno di ogni valore in una colonna. |
Quadrato | Eleva ogni valore della colonna alla potenza di 2. |
Radice quadrata | Restituisce la radice quadrata di ogni valore in una colonna. |
Sottrai | Sottrae un numero decimale positivo o negativo per ogni valore all'interno di colonna. |
Marrone | Restituisce la tangente per ogni valore in una colonna. |
Eseguire calcoli numerici su valori in due colonne
Per applicare un calcolo numerico a due colonne:
- Vai all'area di lavoro Wrangler in Cloud Data Fusion.
- Nella scheda Dati, seleziona la casella di controllo in base ai due nomi di colonna.
- Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
- Seleziona Calcola e scegli un'opzione, ad esempio Aggiungi.
- (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
- Fai clic su Applica.
I valori cambiano in base al calcolo. Wrangler aggiunge il token
come passaggio della formula. Ad esempio, se aggiungi i valori in ogni riga
delle colonne Q1_Sales
e Q2_Sales
e crea una nuova colonna denominata
H1_Sales
, Wrangler aggiunge la seguente trasformazione alla formula:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea
una nuova colonna denominata H1_Sales
con un totale di Q1_Sales
e Q2_Sales
.
Calcoli supportati in due colonne
Puoi eseguire i seguenti calcoli numerici sui valori di ogni riga in due colonne:
Funzione | Descrizione |
---|---|
Aggiungi | Aggiunge un numero decimale positivo o negativo a una colonna o più colonne per produrre la somma di ogni riga. |
Media | Restituisce la media di ogni riga in più colonne. |
Dividi | Divide ogni valore nella colonna per un decimale positivo o negativo oppure Divide ogni valore in due colonne. |
Uguale | Funzione booleana che confronta due colonne per vedere se i valori corrispondono, riga
per riga. Restituisce true o false . |
M.M.M. | Restituisce il minimo comune multiplo di ogni numero in due colonne. |
Max | Restituisce il valore massimo per ogni riga in due colonne. |
Min | Restituisce il valore minimo per ogni riga in due colonne. |
Modulo | Restituisce il resto quando dividi ogni valore nella colonna per una decimale positivo o restituisce il resto quando si divide ciascun valore in due colonne. |
Moltiplica | Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne. |
Sottrazione | Sottrae un numero decimale positivo o negativo per ogni valore all'interno di colonna. |
Eseguire calcoli numerici su valori di tre o più colonne
Cloud Data Fusion supporta l'esecuzione di calcoli numerici sui valori di almeno tre colonne nella versione 6.8.0 e successive.
Per applicare un calcolo numerico a tre o più colonne:
- Vai all'area di lavoro Wrangler in Cloud Data Fusion.
- Nella scheda Dati, seleziona la casella di controllo in base ai due nomi di colonna.
- Vai al nome di una colonna e fai clic sulla freccia di espansione arrow_drop_down.
- Seleziona Calcola e scegli un'opzione, ad esempio Aggiungi.
- (Facoltativo) Per creare una nuova colonna per i valori calcolati, seleziona la casella di controllo Copia in una nuova colonna. In caso contrario, i valori calcolati sostituiscono i valori esistenti.
- Fai clic su Applica.
I valori cambiano in base al calcolo. Wrangler aggiunge il token
come passaggio della formula. Ad esempio, se aggiungi i valori in ogni riga
delle colonne Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
e crei una
nuova colonna denominata 2022_Sales
, Wrangler aggiunge la seguente trasformazione alla
ricetta:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Quando esegui la pipeline di dati, Wrangler esegue la trasformazione e crea
una nuova colonna denominata 2022_Sales
con un totale di Q1_Sales
, Q2_Sales
,
Q3_Sales
e Q4_Sales
.
Calcoli supportati in tre o più colonne
Puoi eseguire i seguenti calcoli sui valori di ogni riga in tre o più colonne:
Funzione | Descrizione |
---|---|
Aggiungi | Aggiunge un numero decimale positivo o negativo a una colonna oppure più colonne per restituire la somma di ogni riga. |
Media | Restituisce la media di ogni riga in più colonne. |
Uguale | Funzione booleana che confronta due colonne per verificare se i valori corrispondono, riga
per riga. Restituisce true o false . |
Max | Restituisce il valore massimo per ogni riga in due colonne. |
Min | Restituisce il valore minimo per ogni riga in due colonne. |
Moltiplica | Moltiplica ogni valore nella colonna per un numero decimale positivo o negativo oppure moltiplica ogni valore in due colonne. |
Passaggi successivi
- Scopri di più sulle istruzioni di Wrangler.