Anda dapat menginstal komponen tambahan seperti Zeppelin saat membuat cluster Dataproc menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Zeppelin.
Komponen Notebook Zeppelin
adalah notebook berbasis Web untuk analisis data interaktif. UI Web Zeppelin
tersedia di port 8080
pada node master pertama cluster.
Secara default, notebook disimpan di Cloud Storage pada bucket staging Dataproc, yang ditentukan oleh pengguna atau dibuat secara otomatis saat cluster dibuat. Lokasi dapat diubah pada waktu pembuatan
cluster melalui
properti zeppelin:zeppelin.notebook.gcs.dir
.
Menginstal komponen
Instal komponen saat Anda membuat cluster Dataproc. Komponen dapat ditambahkan ke cluster yang dibuat dengan Dataproc versi 1.3 dan yang lebih baru.
Lihat Versi Dataproc yang didukung untuk versi komponen yang disertakan dalam setiap rilis image Dataproc.
Perintah gcloud
Untuk membuat cluster Dataproc yang menyertakan komponen Zeppelin, gunakan perintah gcloud dataproc cluster create cluster-name dengan flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
REST API
Komponen Zeppelin dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.Konsol
- Aktifkan gateway komponen dan komponen.
- Di Konsol Google Cloud, buka halaman Buat cluster Dataproc. Panel Siapkan cluster dipilih.
- Di bagian Components:
- Di bagian Optional Components, pilih Zeppelin dan komponen opsional lainnya untuk diinstal di cluster Anda.
- Pada Gateway Komponen, pilih Aktifkan gateway komponen (lihat Melihat dan Mengakses URL Gateway Komponen).
Buka notebook Zeppelin
Lihat Melihat dan Mengakses URL Gateway Komponen untuk mengklik link Gateway Komponen di Konsol Google Cloud guna membuka UI notebook Zeppelin yang berjalan di node master cluster di browser lokal Anda.