Informasi dalam artikel ini memberikan saran dan informasi mendalam tentang penggabungan data untuk membantu Anda memahami cara kerja penggabungan dan menyelesaikan kasus penggunaan yang kompleks. Untuk mendapatkan hasil maksimal dari artikel ini, Anda harus sudah memahami dasar-dasar penggabungan data, yang dibahas dalam artikel lain dalam topik ini.
Gabungan hanya boleh berisi subset data yang tersedia
Sebagai praktik terbaik, Anda hanya boleh menyertakan kolom yang ingin divisualisasikan dalam diagram yang didasarkan pada gabungan. Berikut alasannya:
- Penggabungan dapat menghasilkan set data yang sangat besar, yang dapat menyebabkan lambatnya performa dan naiknya biaya kueri untuk layanan berbayar seperti BigQuery.
- Diagram yang didasarkan pada gabungan menghitung semua baris dalam gabungan meskipun tidak digunakan dalam diagram.
- Misalnya, Anda membuat gabungan yang berisi 10 kolom. Anda kemudian menentukan diagram yang hanya menggunakan 1 dari 10 kolom tersebut. Looker Studio menghitung gabungan 10 kolom, lalu membuat kueri untuk 1 kolom tersebut dalam output gabungan untuk membuat diagram.
- Agregasi ulang hanya terjadi jika gabungan Anda berisi subset data pokok.
Menggunakan penggabungan untuk mengagregasi ulang metrik
Metrik yang Anda sertakan dari sumber data pokok menjadi angka yang tidak diagregasi dalam gabungan. Jika gabungan tidak menyertakan seluruh kumpulan kolom dari sumber data pokok, angka tersebut akan diagregasi ulang berdasarkan data baru. Menggunakan penggabungan dengan cara ini dapat berguna jika Anda perlu menerapkan agregasi yang berbeda ke kolom yang sudah diagregasi, seperti menghitung rata-rata dari rata-rata.
Lihat Menggunakan penggabungan untuk mengagregasi ulang data untuk mengetahui informasi selengkapnya.
Membuat gabungan dari satu sumber data
Gabungan tidak harus menggunakan sumber data yang berbeda. Anda mungkin juga merasa perlu untuk menggabungkan ulang data dengan menggabungkan beberapa tabel dari sumber data yang sama.
Misalnya, Anda memiliki set data yang berisi data populasi untuk tiga county teratas di negara bagian AS yang paling padat penduduknya, seperti yang ditunjukkan dalam tabel berikut:
Status |
County |
Populasi (Estimasi 2023) |
---|---|---|
California |
Los Angeles County |
10.014.009 |
California |
San Diego County |
3.298.634 |
California |
Orange County |
3.186.989 |
Texas |
Harris County |
4.731.145 |
Texas |
Dallas County |
2.613.539 |
Texas |
Tarrant County |
2.110.640 |
New York |
Kings County (Brooklyn) |
2.736.074 |
New York |
Queens County |
2.405.464 |
New York |
Bronx County |
1.418.890 |
Anda ingin menghitung persentase populasi untuk setiap county di negara bagian; tetapi, untuk melakukannya, Anda harus memiliki total populasi setiap negara bagian sebagai kolomnya sendiri. Dalam set data, metrik tersebut tidak tersedia, tetapi Anda bisa mendapatkannya dengan menggabungkan sumber data populasi dengan dirinya sendiri, dengan melakukan langkah-langkah berikut:
- Buat sumber data menggunakan set data dasar Anda.
- Tambahkan diagram yang menggunakan sumber data tersebut ke laporan.
- Buat gabungan dengan dua tabel. Setiap tabel akan menggunakan sumber data yang sama dengan yang Anda buat di langkah 1.
- Untuk Tabel 1, sertakan kolom berikut:
- Negara Bagian, Kabupaten, Populasi.
- Ganti nama Population menjadi CountyPopulation.
- Untuk Tabel 2, cukup sertakan kolom Population, dan ganti namanya menjadi StatePopulation.
- Untuk Tabel 1, sertakan kolom berikut:
- Untuk kondisi join, gunakan join Left Outer, yang menautkan State di Tabel 1 ke State di Tabel 2.
- Klik Simpan.
- Kembali ke editor laporan dengan mengklik X.
Selanjutnya, tambahkan diagram baru (misalnya, tabel) ke laporan Anda dan pilih gabungan sebagai sumber data untuk diagram dengan melakukan langkah-langkah berikut:
- Tambahkan kolom State, County, CountyPopulation, dan StatePopulation ke diagram.
- Untuk menghitung persentase populasi negara bagian untuk setiap county, tambahkan kolom kalkulasi ke diagram yang menggunakan data gabungan baru Anda:
- Di panel properti, klik Tambahkan metrik,lalu klik Tambahkan kolom.
- Beri nama kolom (misalnya) Persentase Populasi Negara Bagian.
- Di kotak Formula, masukkan
(CountyPopulation / StatePopulation)*100
. - (Opsional) Tetapkan Format Tampilan untuk menampilkan nilai persentase ke tingkat yang Anda inginkan (misalnya, Persen (2) untuk dua digit desimal).
Setelah selesai, tabel Anda akan terlihat seperti ini:
Status |
County |
CountyPopulation |
StatePopulation |
Persentase Populasi Negara Bagian |
---|---|---|---|---|
California |
Los Angeles County |
10014009 |
16499632 |
60,69 |
Texas |
Harris County |
4731145 |
9455324 |
50,04 |
California |
San Diego County |
3298634 |
16499632 |
19,99 |
California |
Orange County |
3186989 |
16499632 |
19,32 |
New York |
Kings County (Brooklyn) |
2736074 |
6560428 |
41,71 |
Texas |
Dallas County |
2613539 |
9455324 |
27,64 |
New York |
Queens County |
2405464 |
6560428 |
36,67 |
Texas |
Tarrant County |
2110640 |
9455324 |
22,32 |
New York |
Bronx County |
1418890 |
6560428 |
21,63 |
Urutan tabel dalam gabungan
Looker Studio mengevaluasi konfigurasi join dalam gabungan secara berurutan, dimulai dengan konfigurasi paling kiri. Hasil dari setiap join kemudian diterapkan ke join berikutnya di sebelah kanan. Misalnya, dalam gabungan tiga tabel, konfigurasi join antara tabel 1 (paling kiri) dan tabel 2 (tengah) dievaluasi, lalu hasil tersebut digunakan oleh konfigurasi join antara tabel 2 dan tabel 3 (paling kanan).
Urutan tabel dalam gabungan yang dibuat secara otomatis
Jika Anda menggabungkan beberapa diagram, Looker Studio akan membuat tabel untuk setiap diagram, lalu menambahkan kolom dalam diagram ke tabel yang sesuai. Urutan tabel dalam gabungan mengikuti urutan Anda dalam memilih diagram: diagram pertama yang dipilih menjadi tabel pertama (paling kiri), diagram kedua yang dipilih menjadi tabel kedua, dll.
Looker Studio juga secara otomatis membuat konfigurasi join untuk setiap tabel dan menggunakan jenis left outer join.
Jika konfigurasi default tidak sesuai dengan yang Anda inginkan, atau jika tidak ada penautan yang jelas di antara tabel, Anda dapat mengedit gabungan agar sesuai dengan sasaran.
Tabel dibuat sebelum gabungan
Data untuk setiap tabel dalam gabungan dikueri sebelum disatukan ke dalam gabungan akhir. Rentang tanggal, filter, dan kolom kalkulasi dalam tabel diterapkan ke kueri yang menghasilkan tabel sebelum join dilakukan. Faktor-faktor ini dapat memengaruhi data yang disertakan dalam tabel gabungan dan mengubah output gabungan.
Gabungan dapat berisi lebih banyak baris dibandingkan dengan data asli
Diagram gabungan mungkin akan berisi lebih banyak data daripada yang ada di diagram yang didasarkan pada masing-masing sumber data penyusun gabungan tersebut. Hasilnya dapat bergantung pada data Anda dan konfigurasi join yang dipilih untuk gabungan. Misalnya, left outer join mencakup semua data dari tabel sebelah kiri, serta semua data dari tabel di sebelah kanan yang memiliki nilai yang sama di seluruh kondisi join. Beberapa kecocokan untuk kondisi join dapat menyebabkan lebih banyak baris yang muncul di data gabungan daripada yang ada di sumber data paling kiri.
Gabungan serta filter dan rentang tanggal eksplisit
Dua cara untuk membatasi jumlah baris dalam gabungan Anda adalah dengan menggunakan rentang tanggal atau menerapkan filter. Anda dapat membatasi baris pada diagram yang didasarkan pada gabungan atau tabel penyusun gabungan. Sebaiknya pertimbangkan prosesnya sebagai "pra-gabungan" atau "pasca-gabungan".
Jika Anda menerapkan rentang tanggal atau filter di tabel dalam gabungan, perubahan tersebut diterapkan sebelum data digabungkan dengan tabel lain dalam gabungan. Baris yang berada di luar rentang tanggal atau yang dikecualikan oleh filter tidak dapat digunakan oleh kueri join.
Saat menerapkan rentang tanggal atau filter di diagram berdasarkan pada gabungan, Anda menerapkannya pada data setelah gabungan dibuat ("pasca-gabungan").
Perbedaan ini dapat berdampak besar pada hasil yang Anda lihat dalam diagram, bergantung pada data Anda dan cara Anda mengonfigurasi gabungan tersebut.
Gabungan dan filter warisan
Gabungan mewarisi filter laporan, halaman, atau tingkat grup asalkan filter tersebut kompatibel dengan data pra-gabungan atau pasca-gabungan. Jika filter kompatibel dengan sumber data pokok yang digunakan gabungan, berarti filter tersebut akan memproses data pra-gabungan. Jika tidak, filter akan memproses data pasca-gabungan. Jika filter tidak kompatibel dengan data pra-gabungan atau pasca-gabungan, filter tersebut akan diabaikan.
Pelajari lebih lanjut pewarisan filter.
Jika filter warisan diterapkan pada diagram yang dibuat berdasarkan gabungan, Looker Studio akan memproses data tersebut dalam lima langkah:
(Pra-gabungan):
- Langkah 1: Data dikelompokkan dan diagregasi berdasarkan dimensi yang ditentukan di panel Gabungkan Data.
- Langkah 2: Filter dimensi warisan dan filter metrik yang kompatibel diterapkan ke sumber data yang disertakan di panel Gabungkan Data.
(Gabungan):
- Langkah 3: Data digabungkan menggunakan konfigurasi join yang ditentukan.
(Pasca-gabungan):
- Langkah 4: Data dikelompokkan dan diagregasi berdasarkan dimensi dalam diagram.
- Langkah 5: Filter metrik, jika kompatibel dengan data gabungan, diterapkan ke diagram.