Halaman ini diterjemahkan oleh Cloud Translation API.

Membaca dari sumber streaming Pub/Sub

Cloud Data Fusion mendukung sumber Pub/Sub di pipeline data streaming.

Sebelum memulai

Buat instance Cloud Data Fusion.

Peran dan izin

Untuk mendapatkan izin yang diperlukan untuk membaca dari sumber streaming Pub/Sub, minta administrator untuk memberi Anda peran IAM Pub/Sub Editor (roles/pubsub.editor) pada akun layanan yang digunakan untuk mengakses langganan Pub/Sub. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membaca dari sumber streaming Pub/Sub. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membaca dari sumber streaming Pub/Sub:

pubsub.snapshots.create
pubsub.snapshots.delete
pubsub.snapshots.seek
pubsub.subscriptions.consume
pubsub.topics.attachSubscription

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Anda memberikan peran pada akun layanan yang Anda tentukan di properti plugin untuk mengakses Pub/Sub. Jika tidak ada yang ditentukan, berikan peran di akun layanan Dataproc.

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses.

Menambahkan sumber Pub/Sub ke pipeline data streaming

Buka instance Anda:
1. Di konsol Google Cloud , buka halaman Cloud Data Fusion.
2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.
  
  Buka Instance
Di antarmuka web Cloud Data Fusion, klik Studio.
Pilih Pipeline Data - Realtime.
Di menu Source, pilih Pub/Sub. Node sumber streaming Pub/Sub muncul di pipeline.
Di node Pub/Sub, klik Properties untuk mengonfigurasi sumber. Untuk mengetahui informasi selengkapnya, lihat Sumber Streaming Pub/Sub.

Dukungan untuk satu sumber Pub/Sub tanpa plugin Windower

Cloud Data Fusion versi 6.9.1 mendukung pipeline real time dengan satu sumber streaming Pub/Sub dan tanpa plugin Windower.

Sumber streaming Pub/Sub memiliki dukungan bawaan dan data diproses setidaknya sekali. Pengaktifan checkpoint Spark tidak diperlukan.
Sumber streaming Pub/Sub membuat snapshot Pub/Sub di awal setiap batch dan menghapusnya di akhir setiap batch.
Membuat snapshot Pub/Sub dikenai biaya. Untuk mengetahui informasi selengkapnya, lihat harga Pub/Sub.
Anda dapat memantau pembuatan snapshot di Cloud Audit Logs.

Mengupgrade pipeline dengan sumber streaming Pub/Sub

Cloud Data Fusion mendukung upgrade aplikasi langsung untuk pipeline streaming dengan sumber streaming Pub/Sub yang dibuat di 6.9.1 atau yang lebih baru.

Cloud Data Fusion tidak mendukung upgrade untuk pipeline data dengan sumber streaming Pub/Sub di versi 6.9.0 atau yang lebih lama. Sebagai gantinya, upgrade pipeline tersebut ke 6.9.1:

Berhenti memublikasikan data ke topik saat upgrade instance direncanakan.
Tunggu hingga pipeline selesai memproses data yang dipublikasikan.
Setelah data diproses sepenuhnya, hentikan pipeline.
Upgrade instance.
Buat duplikat pipeline yang ada dan update ke plugin terbaru.
Deploy pipeline.
Jalankan pipeline baru untuk membaca data.

Versi baru otomatis menggunakan snapshot, bukan checkpointing Spark.
Hapus pipeline lama.

Langkah berikutnya

Lihat Sumber Streaming Pub/Sub CDAP.