Halaman ini menjelaskan cara membuat instance Cloud Data Fusion dengan alamat IP internal. Anda membuat instance di jaringan VPC atau jaringan VPC Bersama.
Instance Cloud Data Fusion pribadi memiliki manfaat berikut:
Koneksi ke instance dibuat melalui jaringan VPC pribadi di project Google Cloud Anda. Traffic melalui jaringan tidak melalui internet publik.
Instance dapat terhubung ke resource lokal Anda, seperti database relasional karena jaringan lokal Anda terhubung ke jaringan VPC pribadi Google Cloud melalui Cloud VPN atau Cloud Interconnect. Anda dapat mengakses resource lokal, seperti database, dengan aman melalui jaringan pribadi tanpa membuka akses ke Google Cloud.
Tujuan
- Siapkan jaringan VPC atau jaringan VPC Bersama.
- Alokasikan rentang IP yang akan digunakan untuk men-deploy instance Cloud Data Fusion di project tenant.
- Buat instance pribadi Cloud Data Fusion.
- Siapkan peering jaringan VPC antara VPC yang berisi instance Cloud Data Fusion dan VPC yang berisi project tenant terkait.
- Untuk jaringan VPC Bersama, siapkan izin Identity and Access Management (IAM).
- Jika instance pribadi Anda menggunakan Cloud Data Fusion versi 6.2.0 atau yang lebih lama, buat aturan firewall.
- Izinkan layanan Google Cloud yang berbeda berkomunikasi secara internal satu sama lain dengan mengaktifkan Akses Google Pribadi di subnet Dataproc.
Sebelum memulai
- Untuk mempelajari arsitektur deployment Cloud Data Fusion, lihat Jaringan.
Menyiapkan jaringan VPC
Jika Anda belum melakukannya, buat jaringan VPC atau jaringan VPC Bersama.
Untuk menyiapkan jaringan VPC, Anda harus mengalokasikan rentang alamat IP.
Alokasikan rentang IP
Jaringan VPC
Jika Anda tidak menggunakan jaringan VPC Bersama, Cloud Data Fusion akan mengalokasikan rentang IP secara default saat Anda membuat instance.
Jaringan VPC yang dibagikan
Untuk menggunakan VPC Bersama, Anda harus mengalokasikan rentang IP untuk instance Cloud Data Fusion.
Untuk mengalokasikan rentang IP untuk instance Cloud Data Fusion, ikuti langkah-langkah berikut:
Di konsol Google Cloud, buka halaman VPC networks.
Di kolom Nama, klik jaringan VPC tempat Anda ingin membuat instance Cloud Data Fusion pribadi.
Halaman VPC network details akan terbuka.
Klik Private service connection. Jika diminta, aktifkan Service Networking API dengan mengklik Enable API.
Klik Alokasikan rentang IP.
Beri nama rentang IP Anda.
Untuk Rentang IP, klik Otomatis.
Tentukan ukuran awalan
22
.Klik Alokasikan.
Membuat instance pribadi
Buat instance Cloud Data Fusion pribadi di jaringan VPC atau jaringan VPC Bersama.
Jaringan VPC
Untuk membuat instance di jaringan VPC, gunakan konsol Google Cloud atau cURL.
Jika Anda menggunakan konsol Google Cloud untuk membuat instance pribadi, Cloud Data Fusion akan mengalokasikan rentang alamat IP /22
secara default. Untuk memilih rentang IP yang berbeda, Anda harus menggunakan perintah cURL.
Konsol
Buka halaman Create Data Fusion instance.
Masukkan nama dan deskripsi instance untuk instance Anda.
Pilih Region tempat instance akan dibuat.
Pilih Versi dan Edisi Cloud Data Fusion.
Tentukan akun layanan Dataproc yang akan digunakan untuk menjalankan pipeline Cloud Data Fusion di Dataproc. Akun Compute Engine default telah dipilih sebelumnya.
Luaskan menu Advanced Options dan klik Enable Private IP.
Di kolom Network, pilih jaringan tempat instance akan dibuat.
Klik Create. Diperlukan waktu hingga 30 menit untuk menyelesaikan proses pembuatan instance.
cURL
Untuk memudahkan, Anda dapat mengekspor variabel berikut, atau Anda dapat langsung mengganti nilai ini ke dalam perintah berikut:
export PROJECT=PROJECT_ID
export LOCATION=REGION
export DATA_FUSION_API_NAME=datafusion.googleapis.com
Untuk membuat instance, panggil metode
create()
:
curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" https://$DATA_FUSION_API_NAME/v1/projects/$PROJECT/locations/$LOCATION/instances?instance_id=INSTANCE_ID -X POST -d '{"description": "Private CDF instance created through REST.", "type": "ENTERPRISE", "privateInstance": true, "networkConfig": {"network": "NETWORK_NAME", "ipAllocation": "IP_RANGE"}}'
Ganti kode berikut:
INSTANCE_ID
: String ID yang akan diperoleh instance baru Anda.NETWORK_NAME
: Nama jaringan VPC tempat Anda ingin membuat instance pribadi.IP_RANGE
: Rentang IP yang Anda alokasikan. Untuk menemukan rentang IP di konsol Google Cloud, buka VPC network details > Private service connection > Internal IP range .
Jaringan VPC yang dibagikan
Untuk membuat instance di jaringan VPC Bersama, gunakan cURL, bukan konsol Google Cloud.
cURL
Untuk memudahkan Anda, Anda dapat mengekspor variabel berikut. Atau, Anda dapat langsung mengganti nilai ini dalam perintah berikut:
export PROJECT=PROJECT_ID export LOCATION=REGION export DATA_FUSION_API_NAME=datafusion.googleapis.com
Untuk membuat instance, panggil metode
create()
:
curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" https://$DATA_FUSION_API_NAME/v1/projects/$PROJECT/locations/$LOCATION/instances?instanceId=INSTANCE_ID -X POST -d '{"description": "Private CDF instance created through REST.", "type": "ENTERPRISE", "privateInstance": true, "networkConfig": {"network": "projects/SHARED_VPC_HOST_PROJECT_ID/global/networks/NETWORK_NAME", "ipAllocation": "IP_RANGE"}}'
Ganti kode berikut:
INSTANCE_ID
: String ID yang akan diperoleh instance baru Anda.SHARED_VPC_HOST_PROJECT_ID
: ID project yang menghosting jaringan VPC Bersama.NETWORK_NAME
: Nama jaringan VPC tempat Anda ingin membuat instance pribadi.IP_RANGE
: Rentang IP yang Anda alokasikan. Untuk menemukan rentang IP di konsol Google Cloud, buka halaman VPC network details > Private service connection > Internal IP range.
Menyiapkan peering jaringan VPC
Layanan Cloud Data Fusion yang Anda gunakan di lingkungan desain (misalnya: Wrangler, Pengelola Koneksi, dan Validasi Skema) memulai koneksi jaringan dari VPC project tenant ke sistem sumber. Cloud Data Fusion menggunakan peering jaringan VPC untuk membuat konektivitas jaringan ke VPC atau VPC Bersama yang berisi instance Anda. Peering jaringan VPC memungkinkan Cloud Data Fusion mengakses resource di jaringan Anda melalui alamat IP internal menggunakan VPC Anda sendiri dan kontrolnya. Untuk terhubung dengan resource di jaringan lain, lihat langkah-langkah untuk kasus penggunaan koneksi.
Bagian berikut menjelaskan cara membuat konfigurasi peering antara jaringan Anda dan jaringan project tenant Cloud Data Fusion.
Mendapatkan project ID tenant
Untuk membuat konfigurasi peering, Anda memerlukan ID project tenant.
Buka halaman Instance Cloud Data Fusion.
Di kolom Instance Name, pilih instance.
Di halaman Instance details, salin Tenant project ID, yang diperlukan saat Anda membuat koneksi peering dalam langkah-langkah berikut.
Membuat koneksi peering
Buka halaman VPC network peering.
Klik Buat koneksi > Lanjutkan.
Di halaman Create peering connection yang terbuka, lakukan hal berikut:
- Masukkan Nama untuk koneksi peering Anda.
- Untuk Jaringan VPC Anda, pilih jaringan yang berisi instance Cloud Data Fusion Anda.
- Untuk Peered VPC network, pilih In another project.
- Untuk Project ID, masukkan project ID tenant yang Anda temukan sebelumnya dalam tutorial ini.
Untuk Nama jaringan VPC, pilih jaringan atau masukkan INSTANCE_REGION-INSTANCE_ID.
Ganti kode berikut:
- INSTANCE_REGION: region tempat Anda membuat instance Cloud Data Fusion.
- INSTANCE_ID: ID instance Cloud Data Fusion Anda.
Pilih versi Internet Protocol untuk koneksi peering guna menukar rute IPv4 dan IPv6 antara jaringan VPC Anda dan jaringan VPC yang di-peering. Untuk mengetahui informasi selengkapnya, lihat Peering jaringan VPC.
Pilih Ekspor rute kustom agar rute kustom dapat diekspor dari jaringan VPC Anda ke jaringan VPC tenant.
Pilih apakah akan mengizinkan rute subnet dengan IPv4 publik untuk diimpor atau diekspor ke jaringan VPC Anda.
Klik Create.
Peering jaringan VPC akan aktif segera setelah dibuat.
Menyiapkan izin IAM
Jaringan VPC
Lewati langkah ini dan buka Membuat aturan firewall.
Jaringan VPC yang dibagikan
Jika membuat instance Cloud Data Fusion di jaringan VPC Bersama, Anda harus memberikan peran Compute Network User kepada akun layanan berikut. Untuk memberikan izin ke semua subnet, berikan peran ke project host VPC Bersama.
Untuk mengontrol akses lebih lanjut, berikan peran ke subnet tertentu, dan peran Network Viewer di project host.
- Akun layanan Cloud Data Fusion:
service-PROJECT_NUMBER@gcp-sa-datafusion.iam.gserviceaccount.com
- Akun layanan Dataproc:
service-PROJECT_NUMBER@dataproc-accounts.iam.gserviceaccount.com
PROJECT_NUMBER
adalah nomor project Google Cloud yang berisi instance Cloud Data Fusion Anda.
Untuk mengetahui informasi selengkapnya, lihat Memberikan akses ke akun layanan yang diperlukan.
Membuat aturan firewall
Buat aturan firewall di jaringan VPC yang mengizinkan koneksi SSH masuk dari rentang IP yang Anda tentukan saat membuat instance Cloud Data Fusion pribadi.
Langkah ini diperlukan untuk Cloud Data Fusion versi sebelum 6.2.0. Hal ini memungkinkan komunikasi antara cluster Cloud Data Fusion dan Dataproc yang menjalankan pipeline.
Anda dapat membuat aturan firewall dengan menggunakan konsol Google Cloud atau menggunakan gcloud CLI.
Konsol
Lihat Membuat aturan firewall.
gcloud
Jalankan perintah berikut:
gcloud compute firewall-rules create FIREWALL_NAME-allow-ssh --allow=tcp:22 --source-ranges=IP_RANGE --network=NETWORK_NAME --project=PROJECT_ID
Ganti kode berikut:
FIREWALL_NAME
: Nama aturan firewall yang akan dibuat.IP_RANGE
: Rentang IP yang Anda alokasikan.NETWORK_NAME
: Nama jaringan tempat aturan firewall dilampirkan. Ini adalah nama jaringan VPC tempat Anda membuat instance pribadi.PROJECT_ID
: ID project yang menghosting jaringan VPC.
Langkah-langkah untuk kasus penggunaan koneksi
Bagian berikut menjelaskan kasus penggunaan terkait koneksi untuk instance pribadi.
Mengaktifkan Akses Google Pribadi
Untuk mengakses resource melalui alamat IP internal, Cloud Data Fusion harus membuat cluster Dataproc dan menjalankan pipeline data di subnet yang memiliki Akses Google Pribadi. Anda harus mengaktifkan Akses Google Pribadi untuk subnet yang berisi cluster Dataproc.
- Jika hanya ada satu subnet di region tempat cluster Dataproc diluncurkan, cluster akan diluncurkan di subnet tersebut.
Jika ada beberapa subnet di suatu region, Anda harus mengonfigurasi Cloud Data Fusion untuk memilih subnet dengan Akses Google Pribadi untuk meluncurkan cluster Dataproc.
Untuk mengaktifkan Akses Google Pribadi untuk subnet, lihat Konfigurasi Akses Google Pribadi.
Opsional: Menghubungkan ke sumber lain
Setelah membuat instance pribadi di Cloud Data Fusion, Anda dapat terhubung ke sumber lain, seperti kasus penggunaan berikut:
- Database dan sistem lokal yang berjalan di jaringan VPC lain
- Layanan Google Cloud lainnya yang berjalan di jaringannya sendiri dalam mode pribadi, seperti Cloud SQL
- Sumber di internet publik
Opsional: Mengaktifkan Peering DNS
Aktifkan Peering DNS dalam kasus berikut:
- Saat Cloud Data Fusion terhubung ke sistem melalui nama host, bukan alamat IP
- Saat sistem target di-deploy di belakang load balancer, seperti yang dilakukan di beberapa deployment SAP
Langkah selanjutnya
- Pelajari konsep keamanan di Cloud Data Fusion.
- Pelajari cara terhubung ke resource di jaringan eksternal.
- Pelajari konsep dan fitur Cloud Data Fusion utama lainnya.
- Lihat harga Cloud Data Fusion.