Halaman ini menjelaskan cara memberikan peran Pengguna Akun Layanan Dataproc ke Cloud Data Fusion agar dapat menyediakan dan menjalankan pipeline di cluster Dataproc.
Untuk akun layanan yang digunakan oleh Dataproc, Anda juga perlu
memberikan izin datafusion.instances.runtime
untuk mengakses
resource runtime Cloud Data Fusion.
Baik Anda menggunakan akun layanan yang dikelola pengguna, atau akun layanan Compute Engine default di virtual machine dalam cluster, Anda harus memberikan peran Service Account User ke Cloud Data Fusion. Jika tidak, Cloud Data Fusion tidak dapat menyediakan cluster Dataproc dan error berikut akan muncul saat Anda menjalankan pipeline data:
PROVISION task failed in REQUESTING_CREATE state for program run [pipeline-name] due to Dataproc operation failure: INVALID_ARGUMENT: User not authorized to act as service account '[service-account-name]'
Mendapatkan nama akun layanan
- Di konsol Google Cloud, buka halaman Identity and Access Management.
Buka halaman IAM - Dari pemilih project di bagian atas halaman, pilih project, folder, atau organisasi tempat instance Cloud Data Fusion berada.
- Temukan dan salin nama akun layanan Cloud Data Fusion. Gunakan format berikut:
service-[project-number]@gcp-sa-datafusion.iam.gserviceaccount.com
.
Memberikan izin pengguna akun layanan
- Di konsol Google Cloud, buka halaman Akun Layanan.
Buka halaman Akun Layanan - Klik Pilih project, pilih project tempat akun layanan yang ingin Anda gunakan untuk cluster Dataproc berada, lalu klik Buka.
Klik alamat email akun layanan Dataproc.
Klik tab Izin. Halaman ini menampilkan daftar akun utama yang telah diberi peran di akun layanan.
Klik
Berikan akses.Di kolom New principals, tempel nama akun layanan Cloud Data Fusion yang sebelumnya Anda salin.
Pilih peran Service Account User.
Klik Simpan.
Memberikan peran ke akun layanan Dataproc
Memberikan izin peran pelari
Berikan peran runner Cloud Data Fusion
(roles/datafusion.runner
) ke akun layanan yang digunakan oleh
Dataproc. Tindakan ini akan memberi otorisasi akun layanan Dataproc untuk menjalankan pipeline Cloud Data Fusion di project Anda.
Untuk mengetahui informasi selengkapnya, lihat Mewajibkan izin untuk melampirkan akun layanan ke resource.
Memberikan izin admin Cloud Storage
Di Cloud Data Fusion versi 6.2.0 dan yang lebih baru, berikan peran admin Cloud Storage (roles/storage.admin
) ke akun layanan yang digunakan oleh Dataproc di project Anda.
Langkah selanjutnya
- Pelajari lebih lanjut Kontrol akses di Cloud Data Fusion.
- Pelajari akun layanan Cloud Data Fusion lebih lanjut.