Componente Zeppelin facoltativo di Dataproc

Puoi installare componenti aggiuntivi come Zeppelin quando crei un progetto Dataproc utilizzando il cluster Componenti facoltativi funzionalità. Questa pagina descrive il componente Zeppelin.

Il blocco note di Zeppelin è un blocco note basato sul web per l'analisi interattiva dei dati. The Zeppelin La UI web è disponibile sulla porta 8080 sul primo nodo master del cluster.

Per impostazione predefinita, i notebook vengono salvati in Cloud Storage nel bucket temporaneo Dataproc, specificato dall'utente o creato automaticamente al momento della creazione del cluster. La posizione può essere modificata al momento della creazione del cluster tramite la proprietà zeppelin:zeppelin.notebook.gcs.dir.

Installa il componente

Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successive.

Consulta Versioni Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.

Comando g-cloud

Per creare un cluster Dataproc che includa il componente Zeppelin, utilizza la gcloud dataproc clusters create cluster-name con il flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

Il componente Zeppelin può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.

Console

  1. Attiva il componente e il gateway dei componenti.

Apri il blocco note di Zeppelin

Consulta Visualizzazione e accesso agli URL di Component Gateway per fare clic sui link di Component Gateway nella console Google Cloud per aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo principale del cluster nel browser locale.