Componente Zeppelin facoltativo di Dataproc

Puoi installare componenti aggiuntivi come Zeppelin quando crei un progetto Dataproc utilizzando il cluster Componenti facoltativi funzionalità. Questa pagina descrive il componente Zeppelin.

Il blocco note di Zeppelin è un blocco note basato sul web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080 nel primo nodo master del cluster.

Per impostazione predefinita, i blocchi note vengono salvati in Cloud Storage nel bucket gestione temporanea Dataproc, specificato dall'utente oppure creato automaticamente quando viene creato il cluster. La posizione può essere modificata al momento della creazione del cluster tramite la proprietà zeppelin:zeppelin.notebook.gcs.dir.

Installa il componente

Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successivi.

Consulta Versioni Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.

Comando g-cloud

Per creare un cluster Dataproc che includa il componente Zeppelin, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

Il componente Zeppelin può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di un clusters.create richiesta.

Console

  1. Attiva il componente e il gateway dei componenti.

Apri il notebook Zeppelin

Consulta Visualizzazione e accesso agli URL di Component Gateway per fare clic sui link di Component Gateway nella console Google Cloud per aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo principale del cluster nel browser locale.