Componente Anaconda do Cloud Dataproc

É possível instalar componentes adicionais na criação de um cluster do Cloud Dataproc usando o recurso Componentes opcionais. Nesta página, você conhecerá o componente Anaconda.

O Anaconda (em inglês) é uma distribuição Python e um gerenciador de pacotes com mais de mil pacotes de ciência de dados conhecidos. Ele é instalado em todos os nós do cluster em /opt/conda/anaconda e se torna o interpretador padrão do Python.

Instalar o componente

Instale o componente ao criar um cluster do Cloud Dataproc. Os componentes podem ser adicionados aos clusters criados com o Cloud Dataproc versão 1.3 ou posterior.

Consulte as versões compatíveis com o Cloud Dataproc para ter acesso à versão do componente incluída em cada versão de imagem do Cloud Dataproc.

Comando gcloud

Para criar um cluster do Cloud Dataproc que inclua o componente Anaconda, use o comando gcloud dataproc clusters create cluster-name com a sinalização --optional-components (usando a versão de imagem 1.3 ou posterior).

gcloud dataproc clusters create cluster-name \
    --optional-components=ANACONDA \
    --image-version=1.3 \
  ... other flags

API REST

Especifique o componente Anaconda por meio da API do Cloud Dataproc usando o SoftwareConfig.Component como parte de uma solicitação clusters.create.

Console

No Console do GCP, abra a página Criar um cluster, do Cloud Dataproc. Clique em "Opções avançadas" na parte inferior da página para visualizar a seção "Componentes opcionais".

Clique em "Selecionar componente" para abrir o painel de seleção de Componentes opcionais. Então, selecione um ou mais componentes para instalar no cluster.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Cloud Dataproc
Precisa de ajuda? Acesse nossa página de suporte.