Puedes instalar componentes adicionales, como Hive WebHCat, al crear un clúster de Dataproc mediante la función Componentes opcionales. En esta página se describe el componente WebHCat de Hive.
El componente Hive WebHCat
proporciona una API REST para HCatalog. El servicio REST está disponible en el puerto 50111
del primer nodo maestro del clúster.
Instalar el componente
Instala el componente al crear un clúster de Dataproc. Los componentes se pueden añadir a los clústeres creados con la versión 1.3 de Dataproc o versiones posteriores.
Consulta las versiones de Dataproc compatibles para ver la versión del componente incluida en cada lanzamiento de imagen de Dataproc.
Comando gcloud
Para crear un clúster de Dataproc que incluya el componente Hive WebHCat, usa el comando gcloud dataproc clusters create cluster-name
con la marca --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
API REST
El componente Hive WebHCat se puede especificar a través de la API de Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.Consola
- Habilita el componente.
- En la consola de Google Cloud , abre la página de Dataproc Crear un clúster. Se selecciona el panel Configurar clúster.
- En la sección Componentes, en Componentes opcionales, selecciona Hive, WebHCat y otros componentes opcionales para instalarlos en el clúster.