É possível instalar outros componentes, como o Hive WebHCat, ao criar um cluster do Dataproc usando o recurso Componentes opcionais. Nesta página, você conhecerá o componente Hive WebHCat.
O componente Hive WebHCat (em inglês)
oferece uma API REST para o HCatalog. O serviço REST está disponível na porta 50111
no primeiro nó mestre do cluster.
Instalar o componente
Instale o componente ao criar um cluster do Dataproc. Os componentes podem ser adicionados aos clusters criados com o Dataproc versão 1.3 ou posterior.
Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.
Comando gcloud
Para criar um cluster do Dataproc que inclua o componente Hive WebHCat,
use o comando
gcloud dataproc clusters create cluster-name
com a flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
API REST
O componente Hive WebHCat pode ser especificado por meio de API do Dataproc usando SoftwareConfig.Component como parte de uma solicitação clusters.create.Console
- Ativar o componente.
- No console do Google Cloud, abra a página Criar um cluster do Dataproc. O painel "Configurar cluster" está selecionado.
- Na seção Componentes, em Componentes opcionais, selecione Hive WebHCat e outros componentes opcionais para instalar no cluster.