Puoi installare componenti aggiuntivi come Zeppelin quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Zeppelin.
Il componente Zeppelin Notebook è un notebook basato su web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080
nel primo nodo master del cluster.
Per impostazione predefinita, i notebook vengono salvati in Cloud Storage nel bucket gestione temporanea Dataproc, specificato dall'utente o creato automaticamente al momento della creazione del cluster. La posizione può essere modificata al momento della creazione del cluster tramite la proprietà zeppelin:zeppelin.notebook.gcs.dir
.
Installa il componente
Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successive.
Consulta Versioni Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.
Comando g-cloud
Per creare un cluster Dataproc che includa il componente Zeppelin,
utilizza il comando
gcloud dataproc clusters create cluster-name
con il flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Il componente Zeppelin può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.Console
- Attiva il componente e il gateway dei componenti.
- Nella console Google Cloud, apri la pagina Dataproc Crea un cluster. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Zeppelin e altri componenti facoltativi da installare sul cluster.
- In Gateway dei componenti, seleziona Attiva gateway dei componenti (consulta Visualizzare e accedere agli URL del gateway dei componenti).
Apri il notebook Zeppelin
Consulta Visualizzazione e accesso agli URL di Component Gateway per fare clic sui link di Component Gateway nella console Google Cloud per aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo principale del cluster nel browser locale.