Halaman ini menjelaskan cara memberikan peran Service Account User Dataproc kepada Cloud Data Fusion agar dapat menyediakan dan menjalankan pipeline di cluster Dataproc.
Untuk akun layanan yang digunakan oleh Dataproc, Anda juga harus memberikan izin datafusion.instances.runtime
untuk mengakses resource runtime Cloud Data Fusion.
Baik Anda menggunakan akun layanan yang dikelola pengguna, maupun akun layanan Compute Engine default pada virtual machine dalam cluster, Anda harus memberikan peran Service Account User kepada Cloud Data Fusion. Jika tidak, Cloud Data Fusion tidak dapat menyediakan cluster Dataproc dan error berikut akan muncul saat Anda menjalankan pipeline data:
PROVISION task failed in REQUESTING_CREATE state for program run [pipeline-name] due to Dataproc operation failure: INVALID_ARGUMENT: User not authorized to act as service account '[service-account-name]'
Mendapatkan nama akun layanan
- Di konsol Google Cloud, buka halaman Identity and Access Management.
Buka halaman IAM - Dari pemilih project di bagian atas halaman, pilih project, folder, atau organisasi tempat instance Cloud Data Fusion berada.
- Cari dan salin nama akun layanan Cloud Data Fusion. Gunakan format berikut:
service-[project-number]@gcp-sa-datafusion.iam.gserviceaccount.com
.
Memberikan izin pengguna akun layanan
- Di konsol Google Cloud, buka halaman Akun Layanan.
Buka halaman Service Accounts - Klik Select a project, pilih project tempat akun layanan yang ingin Anda gunakan untuk cluster Dataproc berada, lalu klik Open.
Klik alamat email akun layanan Dataproc.
Klik tab Izin. Halaman ini menampilkan daftar akun utama yang telah diberi peran pada akun layanan.
Klik
Berikan akses.Di kolom New principals, tempel nama akun layanan Cloud Data Fusion yang sebelumnya Anda salin.
Pilih peran Service Account User.
Klik Simpan.
Memberikan peran ke akun layanan Dataproc
Memberikan izin peran runner
Berikan peran runner Cloud Data Fusion (roles/datafusion.runner
) ke akun layanan yang digunakan oleh Dataproc. Tindakan ini memberikan otorisasi kepada akun layanan Dataproc untuk menjalankan pipeline Cloud Data Fusion di project Anda.
Untuk mengetahui informasi selengkapnya, lihat Mewajibkan izin untuk mengaitkan akun layanan ke resource.
Memberikan izin admin Cloud Storage
Di Cloud Data Fusion versi 6.2.0 dan yang lebih baru, berikan peran admin Cloud Storage (roles/storage.admin
) ke akun layanan yang digunakan oleh Dataproc di project Anda.
Langkah selanjutnya
- Pelajari Kontrol akses di Cloud Data Fusion lebih lanjut.
- Pelajari akun layanan Cloud Data Fusion lebih lanjut.