Componente opcional Zeppelin do Dataproc

É possível instalar outros componentes, como o Zeppelin, ao criar um cluster do Dataproc usando o recurso Componentes opcionais. Nesta página, você conhecerá o componente Zeppelin.

O Notebook Zeppelin (em inglês) é um notebook baseado na Web para análise de dados interativos. A IU da Web do Zeppelin está disponível na porta 8080 do primeiro nó mestre do cluster.

Por padrão, os notebooks são salvos no Cloud Storage no bucket de preparação do Dataproc, que é especificado pelo usuário ou criado automaticamente na criação do cluster. O local pode ser alterado no momento da criação do cluster por meio da propriedade zeppelin:zeppelin.notebook.gcs.dir.

Instalar o componente

Instale o componente ao criar um cluster do Dataproc. Os componentes podem ser adicionados aos clusters criados com o Dataproc versão 1.3 ou posterior.

Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.

Comando gcloud

Para criar um cluster do Dataproc que inclua o componente Zeppelin, use o comando gcloud dataproc clusters create cluster-name com a sinalização --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

Especifique o componente Zeppelin por meio da API do Dataproc usando SoftwareConfig.Component como parte de uma solicitação clusters.create.

Console

  1. Ative o componente e o gateway do componente.
    • No console do Google Cloud, abra a página Criar um cluster do Dataproc. O painel "Configurar cluster" está selecionado.
    • Na seção "Componentes", faça o seguinte:

Abrir o notebook Zeppelin

Consulte Visualizar e acessar URLs do Gateway de componentes e clique nos links do Gateway de componentes no console do Google Cloud para abrir a interface do notebook Zeppelin em execução no nó mestre do cluster no navegador local.