Componente opcional Hive WebHCat de Dataproc

Puedes instalar componentes adicionales, como Hive WebHCat, al crear un clúster de Dataproc mediante la función Componentes opcionales. En esta página se describe el componente WebHCat de Hive.

El componente Hive WebHCat proporciona una API REST para HCatalog. El servicio REST está disponible en el puerto 50111 del primer nodo maestro del clúster.

Instalar el componente

Instala el componente al crear un clúster de Dataproc. Los componentes se pueden añadir a los clústeres creados con la versión 1.3 de Dataproc o versiones posteriores.

Consulta las versiones de Dataproc compatibles para ver la versión del componente incluida en cada lanzamiento de imagen de Dataproc.

Comando gcloud

Para crear un clúster de Dataproc que incluya el componente Hive WebHCat, usa el comando gcloud dataproc clusters create cluster-name con la marca --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API REST

El componente Hive WebHCat se puede especificar a través de la API de Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.

Consola

  1. Habilita el componente.
    • En la consola de Google Cloud , abre la página de Dataproc Crear un clúster. Se selecciona el panel Configurar clúster.
    • En la sección Componentes, en Componentes opcionales, selecciona Hive, WebHCat y otros componentes opcionales para instalarlos en el clúster.