Cree un clúster y un servicio de Dataproc Metastore
En esta página, se muestra cómo crear un servicio de Dataproc Metastore y un clúster de Dataproc que usa el servicio como su almacén de metadatos de Hive.
Antes de comenzar
- Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
-
En la página del selector de proyectos de Google Cloud Console, selecciona o crea un proyecto de Google Cloud.
-
Asegúrate de que la facturación esté habilitada para tu proyecto de Cloud. Obtén información sobre cómo verificar si la facturación está habilitada en un proyecto.
-
En la página del selector de proyectos de Google Cloud Console, selecciona o crea un proyecto de Google Cloud.
-
Asegúrate de que la facturación esté habilitada para tu proyecto de Cloud. Obtén información sobre cómo verificar si la facturación está habilitada en un proyecto.
-
Habilita la API de Dataproc Metastore.
Control de acceso
Para crear un servicio, debes solicitar una función de IAM que contenga el permiso de IAM
metastore.services.create
. Las funciones específicasroles/metastore.admin
yroles/metastore.editor
de Dataproc Metastore incluyen permisos de creación.Puedes otorgar permiso de creación a usuarios o grupos mediante las funciones heredadas
roles/owner
yroles/editor
.
Para obtener y configurar políticas de IAM, puedes usar lo siguiente:
- Google Cloud Console: Consulta Control de acceso a través de Google Cloud Console.
- API de REST: Consulta Control de acceso a través de la API.
- Línea de comandos de
gcloud
: Consulta Control de acceso a través de la CLI de Google Cloud.
Para obtener más información, consulta la IAM y el control de acceso de Dataproc Metastore.
Crea un servicio de Dataproc Metastore
En las siguientes instrucciones, se muestra cómo crear un servicio de Dataproc Metastore mediante Google Cloud Console, la CLI de gcloud o la API de Dataproc Metastore.
Console
En Cloud Console, abre la página Crear servicio:
Abre la página Crear servicio en Cloud Console.
En el campo Nombre del servicio, ingresa
example-service
.Selecciona la Ubicación de los datos. Para obtener información sobre cómo seleccionar una región, consulta Ubicaciones de Cloud.
Para otras opciones de configuración del servicio, usa los valores predeterminados proporcionados.
Para crear y, luego, iniciar el servicio, haz clic en el botón Enviar.
El nuevo servicio aparecerá en la lista de servicios.
gcloud
Ejecuta el siguiente comando gcloud metastore services create
para crear una clave:
gcloud metastore services create example-service \ --location=LOCATION
Reemplaza LOCATION
por la región de Compute Engine en la que se creará el servicio. Asegúrate de que Dataproc Metastore esté disponible en la ubicación.
REST
Sigue las instrucciones de la API para crear un servicio mediante el Explorador de API.
Crea un clúster de Dataproc que use el servicio
Después de crear un servicio, puedes crear y adjuntar un clúster de Dataproc que use el servicio como su almacén de metadatos de Hive.
La imagen de Dataproc y la versión de Dataproc Metastore Hive deben ser compatibles. Consulta las siguientes páginas de control de versiones de imágenes para asegurarte de que la versión de Hive sea compatible:
- Versiones de actualización 2.0.x de Dataproc
- Versiones de actualización 1.5.x de Dataproc
- Versiones de actualización 1.4.x de Dataproc
Para obtener más información, consulta la Lista de versiones con imágenes de Dataproc.
Console
En Cloud Console, abre la página Crear un clúster de Dataproc:
En el campo Nombre del clúster, ingresa
example-cluster
.En los menús Región y Zona, selecciona una región y zona para el clúster. Puedes seleccionar una región distinta para aislar recursos y ubicaciones de almacenamiento de metadatos dentro de la región especificada. Si seleccionas una región distinta, puedes seleccionar No corresponde para que la zona permita que Dataproc elija una zona dentro de la región seleccionada de tu clúster (consulta Posición de zona automática de Dataproc).
Usa los valores predeterminados para todas las demás opciones.
Haz clic en la pestaña Personalizar clúster.
En la sección Configuración de red, selecciona la misma red especificada durante la creación del servicio de Metastore.
En la sección Dataproc Metastore, selecciona
example-service
.Haga clic en Create para generar el clúster.
El clúster nuevo aparecerá en la lista de clústeres. El estado del clúster aparece como Aprovisionamiento, hasta que el clúster esté listo para usarse. Su estado cambia a Running."
gcloud
Ejecuta el siguiente comando gcloud dataproc clusters create
para crear un clúster:
gcloud dataproc clusters create example-cluster \ --dataproc-metastore=projects/PROJECT_ID/locations/LOCATION/services/example-service \ --region=LOCATION
Reemplaza PROJECT_ID
por el ID del proyecto en el que creaste tu servicio de Dataproc Metastore.
Reemplaza LOCATION
con la misma región que especificaste antes para el servicio de Dataproc Metastore.
REST
Sigue las instrucciones de la API para crear un clúster mediante el Explorador de API.
Limpia
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
- En la consola de Cloud, ve a la página Administrar recursos.
- Si el proyecto que deseas borrar está vinculado con una organización, expande la lista Organización en la columna Nombre.
- En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
- En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.
Como alternativa, puedes borrar los recursos que se usan en este instructivo de la siguiente manera:
Borra el servicio de Dataproc Metastore.
Console
En Cloud Console, abre la página de Dataproc Metastore:
A la izquierda del nombre del servicio, marca la casilla para seleccionar
example-service
.En la parte superior de la página Dataproc Metastore, haz clic en Borrar para borrar el servicio.
En el cuadro de diálogo, haz clic en Borrar para confirmar la eliminación.
Tu servicio ya no aparece en la lista de servicios.
gcloud
Ejecuta el siguiente comando
gcloud metastore services delete
para borrar un servicio:gcloud metastore services delete example-service \ --location=LOCATION
Reemplaza
LOCATION
por la región de Compute Engine donde se creó el servicio.REST
Sigue las instrucciones de la API para borrar un servicio mediante el Explorador de API.
Todas las eliminaciones se completa de forma exitosa de inmediato.
Borra el bucket de Cloud Storage para el servicio de Dataproc Metastore.
Borra el clúster de Dataproc que usó el servicio de Dataproc Metastore.