Halaman ini menjelaskan cara membaca data dari database PostgreSQL di instance Cloud Data Fusion.
Sebelum memulai
- Buat instance Cloud Data Fusion.
- Aktifkan database PostgreSQL Anda untuk menerima koneksi dari Cloud Data Fusion. Untuk melakukannya secara aman, sebaiknya Anda menggunakan instance Cloud Data Fusion pribadi.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk terhubung ke database PostgreSQL, minta administrator Anda untuk memberi Anda peran IAM berikut:
-
Dataproc Worker (
roles/dataproc.worker
) di akun layanan Dataproc dalam project yang berisi cluster -
Cloud Data Fusion Runner (
roles/datafusion.runner
) di akun layanan Dataproc dalam project yang berisi cluster -
Untuk menggunakan Cloud SQL tanpa Proxy Auth Cloud SQL:
Klien Cloud SQL (
roles/cloudsql.client
) di project yang berisi instance Cloud SQL
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Membuka instance di Cloud Data Fusion
Di konsol Google Cloud , buka halaman Cloud Data Fusion.
Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.
Menyimpan sandi PostgreSQL Anda sebagai kunci aman
Masukkan sandi PostgreSQL Anda sebagai kunci aman untuk mengenkripsi di instance Cloud Data Fusion Anda. Untuk mengetahui informasi selengkapnya tentang kunci, lihat Cloud KMS.
Di UI Cloud Data Fusion, klik Admin sistem > Konfigurasi.
Klik Make HTTP Calls.
Di menu dropdown, pilih PUT.
Di kolom jalur, masukkan
namespaces/default/securekeys/pg_password
.Di kolom Body, masukkan
{"data":"POSTGRESQL_PASSWORD"}
. GantiPOSTGRESQL_PASSWORD
dengan sandi PostgreSQL Anda.Klik Kirim.
Kolom Respons akan memberi tahu Anda jika terjadi error.
Menghubungkan ke Cloud SQL untuk PostgreSQL
Di UI Cloud Data Fusion, klik menu menu dan buka halaman Wrangler.
Klik Tambahkan koneksi.
Pilih Database sebagai jenis sumber yang akan dihubungkan.
Di bagian Google Cloud SQL untuk PostgreSQL, klik Upload.
Upload file JAR yang berisi driver PostgreSQL Anda. File JAR Anda harus mengikuti format
NAME-VERSION.jar
. Jika file JAR Anda tidak mengikuti format ini, ganti namanya sebelum Anda menguploadnya.Klik Berikutnya.
Masukkan nama, nama kelas, dan versi driver di kolom.
Klik Selesai.
Di jendela Tambahkan koneksi yang terbuka, klik Google Cloud SQL untuk PostgreSQL. Nama JAR Anda akan muncul di bagian Google Cloud SQL untuk PostgreSQL.
Isi kolom koneksi yang wajib diisi. Di kolom Password, pilih kunci aman yang Anda simpan sebelumnya. Hal ini memastikan bahwa sandi Anda diambil menggunakan Cloud KMS.
Di kolom Connection string, masukkan string koneksi Anda sebagai:
jdbc:postgresql://google/DATABASE_NAME?cloudSqlInstance=INSTANCE_CONNECTION_NAME&socketFactory=com.google.cloud.sql.postgres.SocketFactory&useSSL=false
Ganti kode berikut:
DATABASE_NAME
: nama database Cloud SQL seperti yang tercantum di tab Database di halaman detail instance.INSTANCE_CONNECTION_NAME
: nama koneksi instance Cloud SQL seperti yang ditampilkan di tab Ringkasan pada halaman detail instance.
Contoh:
jdbc:postgresql://google/postgres?cloudSqlInstance=dis-demo:us-central1:pgsql-1&socketFactory=com.google.cloud.sql.postgres.SocketFactory&useSSL=false
Aktifkan Cloud SQL Admin API.
Klik Uji koneksi untuk memastikan koneksi dapat dibuat dengan database.
Klik Tambahkan koneksi.
Setelah database PostgreSQL Anda terhubung, Anda dapat menerapkan transformasi pada data Anda (di Wrangler), membuat pipeline, dan menulis output ke sink (di Studio).