Laman ini menjelaskan bagaimana melakukan kalkulasi numerik ketika Anda mempersiapkan data dalam ruang kerja Wrangler di Cloud Data Fusion Studio.
Anda dapat melakukan transformasi ini di kolom jenis data berikut:
- Bilangan bulat
- Desimal
- Ganda
- Float
- Long
- Versi singkat
Untuk mengetahui informasi selengkapnya, lihat perintah set-column
.
Anda dapat menggunakan fungsi numerik pada satu atau beberapa kolom. Angka yang tersedia fungsi bervariasi berdasarkan jumlah kolom yang Anda pilih. Anda dapat memilih untuk membuat kolom baru dengan hasil kalkulasi, atau Anda bisa mendapatkan hasilnya akan muncul di kolom tempat Anda menambahkan transformasi.
Jika Anda menerapkan model ke satu kolom, perilakunya akan berbeda dengan jika Anda menerapkan fungsi numerik ke beberapa kolom. Contoh:
- Jika menggunakan fungsi
Multiply()
pada satu kolom, Anda menentukan nilai desimal untuk mengalikan setiap nilai dalam kolom. Wrangler melakukan perkalian pada data sampel dan menampilkan nilai baru dengan atau di kolom baru. - Jika Anda menggunakan fungsi
Multiply()
di beberapa kolom, Wrangler mengalikan nilai di setiap baris untuk kolom yang dipilih dan menampilkan nilai baru di kolom pertama transformasi.
Melakukan kalkulasi numerik pada nilai-nilai dalam satu kolom
Untuk menerapkan penghitungan numerik ke satu kolom, ikuti langkah-langkah berikut:
- Buka ruang kerja Wrangler di Cloud Data Fusion.
- Pada tab Data, buka nama kolom, lalu klik arrow_drop_down panah peluas.
Pilih Hitung, lalu pilih opsi—misalnya, Tambahkan.
Untuk menyelesaikan perhitungan, beberapa fungsi mengharuskan Anda memasukkan desimal dengan sejumlah nilai. Misalnya, jika memilih Kurangi, Anda harus memasukkan nilai untuk kurangi dari setiap baris.
Opsional: untuk membuat kolom baru untuk nilai yang dihitung, pilih Kotak centang Salin ke kolom baru.
Klik Terapkan.
Nilainya berubah berdasarkan penghitungan. Wrangler menambahkan pernyataan
direktif sebagai
langkah dalam resep. Misalnya, jika Anda mengurangi dua dari setiap kotak
di kolom Price
, Wrangler menambahkan transformasi berikut ke
resep:
set-column :Price Price - 2
Saat Anda menjalankan pipeline data, transformasi diterapkan ke semua nilai di kolom.
Penghitungan yang didukung untuk satu kolom
Anda dapat melakukan penghitungan berikut pada semua nilai dalam satu kolom:
Fungsi | Deskripsi |
---|---|
Nilai absolut | Menampilkan nilai absolut untuk setiap nilai dalam kolom. Misalnya, nilai mutlak dari -10 adalah 10. |
Tambahkan | Menambahkan desimal positif atau negatif ke kolom atau menambahkan beberapa kolom untuk menghasilkan jumlah dari setiap baris. |
Arccos | Menampilkan invers kosinus untuk setiap nilai dalam kolom. |
Arcsin | Menampilkan kebalikan dari sin untuk setiap nilai dalam kolom. |
Arctan | Menampilkan invers tangen untuk setiap nilai dalam kolom. |
Ceil | Menampilkan bilangan bulat terkecil yang lebih besar dari atau sama dengan numerik nilai di setiap sel dari kolom. Misalnya, jika nilainya adalah 2,21, Ceil menghasilkan 3. Jika nilainya adalah 5,88, Ceil menampilkan 6. Jika nilai adalah -5.15, Ceil mengembalikan -5. |
Cos | Menampilkan kosinus setiap nilai kolom. |
Kubus | Menambah setiap nilai dalam kolom menjadi pangkat 3. |
Root kubus | Menampilkan akar pangkat tiga dari setiap nilai dalam kolom. |
Membagi | Membagi setiap nilai dalam kolom dengan desimal positif atau negatif atau membagi setiap nilai ke dalam dua kolom. |
Lantai | Menampilkan bilangan bulat terbesar yang lebih besar dari atau sama dengan nilai numerik di setiap sel dari kolom. Misalnya, jika nilainya 2,21, FLOOR menghasilkan 2. Jika nilainya adalah 5,88, FLOOR akan menampilkan 5. Demikian pula, jika nilai adalah -5.15, FLOOR mengembalikan -6. |
Catatan | Menampilkan logaritma dari setiap nilai dalam kolom. |
Modulo | Mengembalikan sisa ketika membagi setiap nilai dalam kolom dengan a desimal positif atau mengembalikan sisanya ketika membagi setiap nilai dalam dua kolom. |
Menggandakan | Mengalikan setiap nilai dalam kolom dengan desimal positif atau negatif atau mengalikan setiap nilai dalam dua kolom. |
Log Alam | Menampilkan logaritma alami dari setiap nilai dalam kolom. |
Kekuatan | Menaikkan nilai kolom ke pangkat nilai yang ditentukan. |
Acak | Menghasilkan nilai Double acak yang tidak dapat diprediksi dalam . |
Putaran | Membulatkan setiap nilai dalam kolom. |
Sin | Menampilkan sin untuk setiap nilai dalam kolom. |
Persegi | Menambah setiap nilai dalam kolom pangkat 2. |
Akar persegi | Menampilkan akar kuadrat dari setiap nilai dalam sebuah kolom. |
Kurangi | Mengurangi desimal positif atau negatif untuk setiap nilai dalam . |
Tan | Menampilkan tangen untuk setiap nilai dalam kolom. |
Melakukan perhitungan numerik pada nilai-nilai dalam dua kolom
Untuk menerapkan perhitungan numerik ke dua kolom, ikuti langkah-langkah berikut:
- Buka ruang kerja Wrangler di Cloud Data Fusion.
- Pada tab Data, centang kotak di samping dua nama kolom.
- Buka nama kolom dan klik arrow_drop_down panah peluas.
- Pilih Hitung, lalu pilih opsi—misalnya, Tambahkan.
- Opsional: untuk membuat kolom baru untuk nilai yang dihitung, pilih Kotak centang Salin ke kolom baru. Jika tidak, nilai yang dihitung akan nilai-nilai yang sudah ada.
- Klik Terapkan.
Nilainya berubah berdasarkan penghitungan. Wrangler menambahkan pernyataan
direktif sebagai
langkah dalam resep. Misalnya, jika Anda menambahkan nilai di setiap baris
dari kolom Q1_Sales
dan Q2_Sales
dan membuat kolom baru bernama
H1_Sales
, Wrangler akan menambahkan transformasi berikut ke resep:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Saat Anda menjalankan pipeline data, Wrangler melakukan transformasi dan membuat
kolom baru bernama H1_Sales
dengan total Q1_Sales
dan Q2_Sales
.
Penghitungan yang didukung dalam dua kolom
Anda dapat melakukan kalkulasi numerik berikut ini pada nilai di setiap baris dalam dua kolom:
Fungsi | Deskripsi |
---|---|
Tambahkan | Menambahkan desimal positif atau negatif ke kolom atau menambahkan beberapa kolom untuk menghasilkan output jumlah setiap baris. |
Rata-rata | Menampilkan rata-rata setiap baris dalam beberapa kolom. |
Membagi | Membagi setiap nilai dalam kolom dengan desimal positif atau negatif atau membagi setiap nilai ke dalam dua kolom. |
Sama | Fungsi Boolean yang membandingkan dua kolom untuk melihat apakah nilai cocok, baris
menurut baris. Menampilkan true atau false . |
LCM | Menampilkan kelipatan persekutuan terkecil dari setiap angka dalam dua kolom. |
Maksimal | Menampilkan nilai maksimum untuk setiap baris dalam dua kolom. |
Mnt | Menampilkan nilai minimum untuk setiap baris dalam dua kolom. |
Modulo | Mengembalikan sisa ketika membagi setiap nilai dalam kolom dengan a desimal positif atau mengembalikan sisanya ketika membagi setiap nilai menjadi dua seperti baris dan kolom. |
Menggandakan | Mengalikan setiap nilai dalam kolom dengan desimal positif atau negatif atau mengalikan setiap nilai dalam dua kolom. |
Kurangi | Mengurangi desimal positif atau negatif untuk setiap nilai dalam . |
Melakukan perhitungan numerik pada nilai-nilai dalam tiga kolom atau lebih
Cloud Data Fusion mendukung pelaksanaan kalkulasi numerik pada nilai dalam tiga kolom atau lebih dalam versi 6.8.0 dan yang lebih baru.
Untuk menerapkan perhitungan numerik ke tiga kolom atau lebih, ikuti langkah-langkah berikut:
- Buka ruang kerja Wrangler di Cloud Data Fusion.
- Pada tab Data, centang kotak di samping dua nama kolom.
- Buka nama kolom dan klik arrow_drop_down panah peluas.
- Pilih Hitung, lalu pilih opsi—misalnya, Tambahkan.
- Opsional: untuk membuat kolom baru untuk nilai yang dihitung, pilih Kotak centang Salin ke kolom baru. Jika tidak, nilai yang dihitung akan nilai-nilai yang sudah ada.
- Klik Terapkan.
Nilainya berubah berdasarkan penghitungan. Wrangler menambahkan pernyataan
direktif sebagai
langkah dalam resep. Misalnya, jika Anda menambahkan nilai di setiap baris
dari kolom Q1_Sales
, Q2_Sales
, Q3_Sales
, dan Q4_Sales
, lalu buat
kolom baru bernama 2022_Sales
, Wrangler menambahkan transformasi berikut ke
resepnya:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Saat Anda menjalankan pipeline data, Wrangler melakukan transformasi dan membuat
kolom baru bernama 2022_Sales
dengan total Q1_Sales
, Q2_Sales
,
Q3_Sales
, dan Q4_Sales
.
Penghitungan yang didukung dalam tiga kolom atau lebih
Anda dapat melakukan perhitungan berikut pada nilai di setiap baris dalam tiga atau kolom lagi:
Fungsi | Deskripsi |
---|---|
Tambahkan | Menambahkan desimal positif atau negatif ke kolom atau menambahkan beberapa kolom untuk menghasilkan output jumlah setiap baris. |
Rata-rata | Menampilkan rata-rata setiap baris dalam beberapa kolom. |
Sama | Fungsi Boolean yang membandingkan dua kolom untuk melihat apakah nilai cocok, baris
menurut baris. Menampilkan true atau false . |
Maksimal | Menampilkan nilai maksimum untuk setiap baris dalam dua kolom. |
Mnt | Menampilkan nilai minimum untuk setiap baris dalam dua kolom. |
Menggandakan | Mengalikan setiap nilai dalam kolom dengan desimal positif atau negatif atau mengalikan setiap nilai dalam dua kolom. |
Langkah selanjutnya
- Pelajari perintah Wrangler lebih lanjut.