Anda dapat menginstal komponen tambahan seperti Zeppelin saat membuat cluster Dataproc menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Zeppelin.
Komponen Zeppelin Notebook adalah notebook berbasis Web untuk analisis data interaktif. UI Web
Zeppelin tersedia di port 8080
pada node master pertama cluster.
Secara default, notebook disimpan di Cloud Storage
di bucket staging Dataproc, yang ditentukan oleh pengguna atau
dibuat otomatis
saat cluster dibuat. Lokasi dapat diubah pada waktu pembuatan
cluster melalui
properti zeppelin:zeppelin.notebook.gcs.dir
.
Menginstal komponen
Instal komponen saat Anda membuat cluster Dataproc. Komponen dapat ditambahkan ke cluster yang dibuat dengan Dataproc versi 1.3 dan yang lebih baru.
Lihat Versi Dataproc yang didukung untuk mengetahui versi komponen yang disertakan dalam setiap rilis image Dataproc.
perintah gcloud
Untuk membuat cluster Dataproc yang menyertakan komponen Zeppelin, gunakan perintah cluster-name gcloud dataproc clusters create dengan flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
REST API
Komponen Zeppelin dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.Konsol
- Aktifkan komponen dan gateway komponen.
- Di konsol Google Cloud, buka halaman Create a cluster Dataproc. Panel Siapkan cluster dipilih.
- Di bagian Komponen:
- Di bagian Komponen opsional, pilih Zeppelin dan komponen opsional lainnya untuk diinstal di cluster Anda.
- Di bagian Component Gateway, pilih Enable component gateway (lihat Melihat dan Mengakses URL Component Gateway).
Membuka notebook Zeppelin
Lihat Melihat dan Mengakses URL Component Gateway untuk mengklik link Component Gateway di konsol Google Cloud guna membuka UI notebook Zeppelin yang berjalan di node master cluster di browser lokal Anda.