Tutorial ini menunjukkan cara membuat dan men-deploy tugas yang terus mereplikasi data yang diubah dari database MySQL ke tabel BigQuery.
Tujuan
Dalam tutorial ini, Anda telah:
- Deploy database MySQL Anda di Compute Engine.
- Siapkan database MySQL Anda untuk mengaktifkan replikasi.
- Membuat dan menjalankan tugas replikasi Cloud Data Fusion.
- Lihat hasilnya di BigQuery.
Biaya
Dalam dokumen ini, Anda menggunakan komponen Google Cloud yang dapat ditagih berikut:
Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda,
gunakan kalkulator harga.
Saat Replikasi berjalan, Anda akan ditagih untuk cluster Dataproc dan biaya pemrosesan untuk BigQuery akan dikenakan. Untuk mengoptimalkan biaya ini, sebaiknya gunakan harga tetap BigQuery.
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Data Fusion, BigQuery, and Cloud Storage.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Data Fusion, BigQuery, and Cloud Storage.
- Buat instance Cloud Data Fusion publik dalam versi 6.3.0 atau yang lebih baru. Jika Anda
membuat instance
pribadi, siapkan peering jaringan VPC.
- Saat Anda membuat instance, aktifkan Replikasi dengan mengklik Add Accelerators dan mencentang kotak Replication.
- Untuk mengaktifkannya dalam instance yang ada, lihat Mengaktifkan Replikasi.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk tutorial ini, lihat Kontrol akses dengan IAM dan Memberikan izin pengguna akun layanan.
Menginstal MySQL di Compute Engine
Download image Docker Server MySQL.
Upload image Docker ke Artifact Registry.
Deploy image Docker Anda pada instance VM baru.
Di halaman Disks Compute Engine, ubah ukuran disk menjadi
500 GB
dan mulai ulang VM.Buat firewall untuk instance VM tersebut.
Instal database contoh Sakila.
Mengaktifkan replikasi di database MySQL Anda
Untuk mengaktifkan replikasi, siapkan Change Data Capture (CDC) di MySQL.
Membuat dan menjalankan tugas replikasi Cloud Data Fusion
Upload driver JDBC
Download driver JDBC MySQL (versi 8 atau yang lebih baru) ke komputer lokal Anda.
Di antarmuka web Cloud Data Fusion, upload driver JDBC.
Gunakan nilai berikut untuk mengonfigurasi driver JDBC:
- Di kolom Name, masukkan
mysql
. - Di kolom Version, gunakan nilai default.
- Di kolom Class Name, masukkan
com.mysql.jdbc.Driver
.
- Di kolom Name, masukkan
Buat tugas
Di antarmuka web Cloud Data Fusion, klik Replikasi.
Klik
Create a replication job.Di halaman Create new replication job, tentukan tugas replikasi Name, lalu klik Next.
Konfigurasikan sumber:
- Pilih MySQL sebagai sumber.
- Untuk Host, masukkan nama host server MySQL yang akan dibaca.
- Untuk Port, masukkan port yang akan digunakan untuk terhubung ke server MySQL:
3306
. - Untuk JDBC Plugin Name , pilih
mysql
atau nama yang Anda tentukan saat mengonfigurasi driver JDBC. - Untuk Database Name, masukkan
sakila
. - Di bagian Kredensial, masukkan nama pengguna dan sandi Anda untuk mengakses server MySQL.
Klik Next.
Konfigurasikan target:
- Pilih target BigQuery.
- Project ID dan Kunci Akun Layanan akan terdeteksi secara otomatis. Biarkan nilai default tersebut.
- Opsional: Di bagian Lanjutan, konfigurasikan nama bucket staging, lokasi, interval pemuatan, awalan tabel staging, dan perilaku saat tabel atau database dihapus.
Klik Next.
Jika koneksi berhasil, daftar tabel database contoh Sakila akan ditampilkan. Untuk tutorial ini, pilih beberapa tabel dan peristiwa yang akan direplikasi, seperti peristiwa Sisipkan, Update, dan Hapus.
Opsional: Konfigurasikan properti lanjutan. Untuk tutorial ini, Anda dapat menggunakan setelan default.
Klik Next.
Di halaman Tinjau penilaian, klik Lihat pemetaan oleh salah satu tabel untuk penilaian masalah skema, fitur yang tidak ada, atau masalah konektivitas yang mungkin terjadi selama replikasi. Jika terjadi, masalah tersebut harus diselesaikan sebelum Anda dapat melanjutkan. Untuk tutorial ini, jika salah satu tabel mengalami masalah, kembali ke langkah tempat Anda memilih tabel dan pilih tabel atau peristiwa (Sisipkan, Pembaruan, atau Hapus) tanpa masalah.
Untuk mengetahui informasi selengkapnya tentang konversi jenis data dari database sumber ke tujuan BigQuery, lihat Jenis data replikasi.
Klik Next.
Tinjau detail tugas replikasi ringkasan, lalu klik Deploy replication job.
Memulai tugas
- Di halaman Detail tugas replikasi, klik Mulai.
Tugas replikasi beralih dari status Provisioning ke Starting ke Running. Dalam status yang berjalan, tugas replikasi memuat snapshot awal dari data tabel yang Anda pilih ke BigQuery. Dalam status ini, status tabel dicantumkan sebagai Snapshot. Setelah snapshot awal dimuat ke BigQuery, setiap perubahan yang dilakukan pada tabel akan direplikasi ke BigQuery, dan status tabel akan tercantum sebagai Replicating.
Memantau tugas
Anda dapat memulai dan menghentikan tugas replikasi, meninjau konfigurasi dan log-nya, serta memantau tugas replikasi Anda.
Anda dapat memantau aktivitas tugas replikasi dari halaman Detail tugas replikasi.
Dari halaman Replication, klik tugas replikasi Name.
Klik Monitoring.
Lihat hasil di BigQuery
Tugas replikasi akan membuat set data dan tabel yang direplikasi di BigQuery, dengan nama yang diwariskan dari nama database dan tabel MySQL yang sesuai.
Di konsol Google Cloud, buka halaman BigQuery.
Di panel kiri, pilih nama project Anda untuk memperluas daftar set data.
Untuk melihat hasilnya, pilih set data
sakila
dan pilih tabel.
Untuk mengetahui informasi selengkapnya, baca dokumentasi BigQuery.
Pembersihan
Agar tidak dikenakan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource-nya.
Setelah menyelesaikan tutorial, bersihkan resource yang Anda buat di Google Cloud agar tidak menghabiskan kuota dan Anda tidak akan ditagih di masa mendatang. Bagian berikut menjelaskan cara menghapus atau menonaktifkan resource ini.
Menghapus instance Cloud Data Fusion
Ikuti petunjuk untuk menghapus instance Cloud Data Fusion.
Menghapus project
- Di konsol Google Cloud, buka halaman Manage resource.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Langkah selanjutnya
- Pelajari Replikasi di Cloud Data Fusion lebih lanjut.
- Lihat Referensi Replikasi API.
- Ikuti tutorial untuk Mereplikasi data dari SQL Server ke BigQuery.
- Selesaikan tutorial Mereplikasi data dari Oracle ke BigQuery.