Componente opcional de Hive WebHCat de Dataproc

Puedes instalar componentes adicionales como Hive WebHCat cuando creas un clúster de Dataproc mediante la función Componentes opcionales. En esta página, se describe el componente Hive WebHCat.

El componente Hive WebHCat proporciona una API de REST para HCatalog. El servicio de REST está disponible en el puerto 50111 del primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Dataproc. Los componentes se pueden agregar a los clústeres creados con la versión 1.3 de Dataproc y las posteriores.

Consulta las versiones compatibles de Dataproc para la versión del componente incluida en cada versión de la imagen de Dataproc.

Comando de gcloud

Para crear un clúster de Dataproc que incluya el componente de Hive WebHCat, usa el comando gcloud dataproc clusters create cluster-name con la marca --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API de REST

El componente WebHCat de Hive se puede especificar mediante la API de Dataproc con SoftwareConfig.Component como parte de una solicitud clusters.create.

Consola

  1. Habilita el componente.
    • En la consola de Google Cloud, abre la página Crear un clúster de Dataproc. Se selecciona el panel Configurar clúster.
    • En la sección Componentes, en Componentes opcionales, selecciona Hive WebHCat y otros componentes opcionales para instalar en tu clúster.