Sie können zusätzliche Komponenten wie Zeppelin installieren, wenn Sie einen Dataproc-Cluster mit der Funktion Optionale Komponenten erstellen. Auf dieser Seite wird die Zeppelin-Komponente erläutert.
Die Zeppelin Notebook-Komponente ist ein webbasiertes Notebook für interaktive Datenanalysen. Die Web-UI von Zeppelin ist über Port 8080
auf dem ersten Masterknoten des Clusters verfügbar.
Notebooks werden standardmäßig im Dataproc-Staging-Bucket in Cloud Storage gespeichert. Dieser Bucket wird vom Nutzer festgelegt oder bei der Clustererstellung automatisch generiert. Der Standort kann zum Zeitpunkt der Clustererstellung über das zeppelin:zeppelin.notebook.gcs.dir
-Attribut geändert werden.
Komponente installieren
Installieren Sie die Komponente, wenn Sie einen Dataproc-Cluster erstellen. Sie können Komponenten in Cluster einfügen, die mit Dataproc Version 1.3 oder höher erstellt wurden.
Informationen zu den Komponentenversionen, die im jeweiligen Dataproc-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Dataproc-Versionen.
gcloud-Befehl
Zum Erstellen eines Dataproc-Clusters, der die Zeppelin-Komponente enthält, verwenden Sie den Befehl gcloud dataproc clusters create cluster-name mit dem Flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
REST API
Die Zeppelin-Komponente kann über die Dataproc API mit SoftwareConfig.Component als Teil einer clusters.create-Anfrage angegeben werden.Console
- Aktivieren Sie die Komponente und das Komponentengateway.
- Öffnen Sie in der Google Cloud Console die Dataproc-Seite Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt.
- Im Bereich „Komponenten“:
- Wählen Sie unter „Optionale Komponenten“ Zeppelin und andere optionale Komponenten aus, die auf Ihrem Cluster installiert werden sollen.
- Wählen Sie unter Component Gateway „Component Gateway aktivieren“ aus (siehe Component Gateway-URLs ansehen und aufrufen).
Zeppelin-Notebook öffnen
Lesen Sie den Abschnitt Component Gateway-URLs ansehen und auf diese zugreifen. Darin erfahren Sie, wie Sie in der Google Cloud Console auf Component Gateway-Links klicken, um die Zeppelin-Notebook-UI zu öffnen, die auf dem Masterknoten des Clusters in Ihrem lokalen Browser ausgeführt wird.