Puoi installare componenti aggiuntivi come Zeppelin quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. In questa pagina viene descritto il componente Zeppelin.
Il componente Blocco note Zeppelin è un blocco note basato sul web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080
sul primo nodo master del cluster.
Per impostazione predefinita, i blocchi note vengono salvati in Cloud Storage nel bucket gestione temporanea Dataproc, specificato dall'utente o creato automaticamente al momento della creazione del cluster. La località può essere modificata al momento della creazione del cluster tramite la proprietà zeppelin:zeppelin.notebook.gcs.dir
.
Installa il componente
Installa il componente quando crei un cluster Dataproc. Puoi aggiungere componenti ai cluster creati con Dataproc versione 1.3 e successive.
Consulta le versioni di Dataproc supportate per la versione dei componenti inclusa in ogni release di immagine Dataproc.
Comando g-cloud
Per creare un cluster Dataproc che includa il componente Zeppelin, utilizza il comando cluster-name gcloud dataproc clusters create con il flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Il componente Zeppelin può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.Console
- Abilita il gateway del componente e del componente.
- Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Zeppelin e altri componenti facoltativi da installare sul cluster.
- In Gateway dei componenti, seleziona Abilita gateway dei componenti (consulta Visualizzazione e accesso agli URL del gateway dei componenti).
Apri il blocco note Zeppelin
Consulta Visualizzazione e accesso agli URL del gateway dei componenti per fare clic sui link del gateway dei componenti nella console Google Cloud per aprire l'interfaccia utente del blocco note di Zeppelin in esecuzione sul nodo master del cluster nel browser locale.