É possível instalar outros componentes, como Hive WebHCat, ao criar um cluster do Dataproc usando o recurso Componentes opcionais. Nesta página, você conhecerá o componente Hive WebHCat.
O Hive WebHCat (em inglês) contém uma API REST para o HCatalog. O serviço REST está disponível na porta 50111
no primeiro nó mestre do cluster.
Instalar o componente
Instale o componente ao criar um cluster do Dataproc. Os componentes podem ser adicionados aos clusters criados com o Dataproc versão 1.3 ou posterior.
Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.
Comando gcloud
Para criar um cluster do Dataproc que inclua o componente Hive WebHCat, use o comando gcloud dataproc clusters create cluster-name com a sinalização --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
API REST
O componente Hive WebHCat pode ser especificado por meio da API Dataproc usando o SoftwareConfig.Component como parte de uma solicitação clusters.create.Console
- Ativar o componente.
- No console do Google Cloud, abra a página Criar um cluster do Dataproc. O painel "Configurar cluster" está selecionado.
- Na seção "Componentes", em "Componentes opcionais", selecione Hive WebHCat e outros componentes opcionais para instalar no cluster.