Componente opcional Hive WebHCat do Dataproc

É possível instalar outros componentes, como o Hive WebHCat, ao criar um cluster do Dataproc usando o recurso Componentes opcionais. Nesta página, você conhecerá o componente Hive WebHCat.

O componente Hive WebHCat (em inglês) oferece uma API REST para o HCatalog. O serviço REST está disponível na porta 50111 no primeiro nó mestre do cluster.

Instalar o componente

Instale o componente ao criar um cluster do Dataproc. Os componentes podem ser adicionados aos clusters criados com o Dataproc versão 1.3 ou posterior.

Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.

Comando gcloud

Para criar um cluster do Dataproc que inclua o componente Hive WebHCat, use o método gcloud dataproc clusters create cluster-name com a sinalização --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API REST

O componente Hive WebHCat pode ser especificado por meio de API do Dataproc usando SoftwareConfig.Component como parte de uma solicitação clusters.create.

Console

  1. Ativar o componente.
    • No console do Google Cloud, abra o Dataproc Criar um cluster página. O painel "Configurar cluster" está selecionado.
    • Na seção Componentes, em Componentes opcionais, selecione Hive WebHCat e outros componentes opcionais para instalar no cluster.