Componente Hive WebHCat de Cloud Dataproc

Puedes instalar componentes adicionales cuando creas un clúster de Dataproc con la función de componentes opcionales. En esta página, se describe el componente Hive WebHCat.

El componente Hive WebHCat proporciona una API de REST para hCatalog. El servicio de REST está disponible en el puerto 50111 del primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Dataproc. Los componentes se pueden agregar a los clústeres creados con la versión 1.3 de Dataproc y las posteriores.

Consulta las versiones compatibles de Cloud Dataproc para la versión del componente incluida en cada versión de la imagen de Dataproc.

Comando de gcloud

Para crear un clúster de Dataproc que incluya el componente Hive WebHCat, use el comando gcloud dataproc clusters create cluster-name con la marca --optional-components (con la versión 1.3 o posterior de la imagen).

    gcloud dataproc clusters create cluster-name \
        --optional-components=HIVE_WEBHCAT \
        --image-version=1.3 \
        --region=region \
        ... other flags
    

API de REST

El componente Hive WebHCat se puede especificar con la API de Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.

Console

En Cloud Console, abre la página Crear un clúster de Dataproc. Haz clic en “Opciones avanzadas” en la parte inferior de la página para ver la sección Componentes opcionales.

Haz clic en “Seleccionar componente” para abrir el panel de selección Componentes opcionales. Selecciona uno o más componentes para instalar en tu clúster.