Actualiza un servicio de Dataproc Metastore

En esta página, se explica cómo actualizar un servicio de Dataproc Metastore.

Puedes actualizar tu servicio de Dataproc Metastore para cambiar parámetros de configuración de la red o habilitar o inhabilitar funciones opcionales.

Antes de comenzar

Roles obligatorios

A fin de obtener el permiso que necesitas para actualizar un servicio de Dataproc Metastore, haz lo siguiente: solicita a tu administrador que te otorgue el los siguientes roles de IAM en tu proyecto, según el principio de privilegio mínimo:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene las metastore.services.update, que es necesaria para actualizar un servicio de Dataproc Metastore.

También puedes obtener este permiso con roles personalizados o con otros roles predefinidos.

Para obtener más información sobre roles y permisos específicos de Dataproc Metastore, consulta Descripción general de IAM de Dataproc Metastore.

Información acerca de la actualización de un servicio

Puedes actualizar los siguientes parámetros de Dataproc Metastore.

  • Número de puerto. Actualiza el número de puerto TCP de la interfaz de Apache Thrift.
  • Nivel de servicio. Cambia entre el nivel de servicio Desarrollador o el nivel de servicio Empresa. Estos niveles influyen en la capacidad del servicio.
  • Sincronización de Data Catalog. Activa o desactiva la función de sincronización de Data Catalog.
  • Período de mantenimiento. Cambia la frecuencia del período de mantenimiento, incluidas las opciones Día de la semana y Hora del día.
  • Kerberos Habilitar o inhabilitar la autenticación de Kerberos Si anteriormente estaba habilitada, puede actualizar los archivos de configuración de Kerberos.
  • Configuración del almacén de metadatos de Hive. Actualiza la ubicación de tu directorio de almacén de Hive.
  • Configuración de la versión auxiliar (versión preliminar). Habilita, inhabilita o agrega versiones auxiliares adicionales.
  • Etiquetas. Agrega o quita etiquetas opcionales que describen tus metadatos.
  • Factor de escala. Cambia el factor de escala. Puedes habilitar o inhabilitar el ajuste de escala automático y actualizar los factores de escalamiento mínimo o máximo.

Actualizar un servicio

Antes de ejecutar una actualización, ten en cuenta las siguientes consideraciones:

  • Solo puedes ejecutar un trabajo de actualización a la vez (para cada servicio de Dataproc Metastore).
  • Puedes actualizar varios parámetros en un solo trabajo de actualización.
  • Puedes seguir usando Dataproc Metastore mientras se actualiza.

Cuando la actualización se realiza correctamente, Dataproc Metastore entra automáticamente en un estado activo. Si la actualización falla, Luego, el servicio de Dataproc Metastore revierte a su estado correcto anterior.

En las siguientes instrucciones, se muestra cómo actualizar un Dataproc Metastore servicio.

Console

  1. En la consola de Google Cloud, abre la página Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la página Dataproc Metastore, haz clic en el nombre del servicio de la servicio que quieres actualizar.

    Se abrirá la página Detalle del servicio.

    Página de detalles del servicio
    Página de detalles del servicio de Dataproc Metastore
    .
  3. En la pestaña Configuración, haz clic en Editar.

    Se abrirá la página Editar servicio.

  4. Elige los valores que quieres actualizar para tu servicio.

  5. Haz clic en Enviar.

    Regresa a la página Dataproc Metastore. verificarás que tu servicio se haya actualizado correctamente.

gcloud CLI

  1. Para actualizar un servicio, ejecuta el siguiente comando gcloud metastore services update:

    gcloud metastore services update SERVICE \
        --location=LOCATION \
        --port=PORT \
        --tier=TIER \
        --maintenance-window-day=MAINTENANCE_WINDOW_DAY \
        --maintenance-window-hour=MAINTENANCE_WINDOW_HOUR \
        --kerberos_principal=KERBEROS_PRINCIPAL \
        --keytab=KEYTAB \
        --krb5-config=KRB5_CONFIG \
        --update-hive-metastore-configs-from-file=[KEY=VALUE, ...] \
        --clear-hive-metastore-configs \
        --remove-hive-metastore-configs=[KEY, ...] \
        --update-labels=[KEY=VALUE, ...] \
        --clear-labels \
        --remove-labels=[KEY, ...]
    

    Reemplaza lo siguiente:

    • SERVICE: Es el nombre de tu servicio de Dataproc Metastore.
    • LOCATION: Es la región de Google Cloud en la que reside tu servicio de Dataproc Metastore.
    • PORT: Es el puerto TCP de la interfaz de Thrift que estás usando con tu servicio de Dataproc Metastore (opcional).
    • TIER: Es la capacidad del nivel de tu servicio de Dataproc Metastore (opcional).
    • MAINTENANCE_WINDOW_DAY: Indica el día de la semana en el que (opcional). comienza la ventana de servicio.
    • MAINTENANCE_WINDOW_HOUR: Es la hora del día en la que comienza la ventana de servicio.
    • KERBEROS_PRINCIPAL: Un Kerberos (opcional) principal que existe en la pestaña keytab y en KDC. Un principal tiene el formato “primary/instance@REALM”, pero no hay formato exacto.
    • KEYTAB: Es un archivo keytab de Kerberos que (opcional) se utiliza para autenticar un servicio principal con una clave Kerberos de distribución de Google Cloud.
    • KRB5_CONFIG: (Opcional) El archivo krb5.config especifica el KDC y la información del dominio de Kerberos, que incluye ubicaciones del KDC y configuraciones predeterminadas para las aplicaciones de Kerberos y el dominio.
    • [KEY, ...]: El almacén de metadatos de Hive (opcional) de configuración que quieres actualizar. Si existe una variable en este campo, se actualiza su valor. De lo contrario, se crea una nueva variable. Si se establece esta marca, entonces -clear-hive-metastore-configs es configurar automáticamente.
    • [KEY, ...]: El almacén de metadatos de Hive (opcional) de configuración que quieres quitar.
    • [KEY=VALUE, ...]: Las etiquetas o El par clave-valor del almacén de metadatos de Hive te configura quieres actualizar.
    • [KEY, ...]: Las etiquetas o Configuración del par clave-valor del almacén de metadatos de Hive que quieres quitar.
  2. Verifica que la actualización se haya realizado correctamente.

REST

Sigue las instrucciones de la API para actualizar un servicio mediante el Explorador de API.

Actualiza la configuración del almacén de Metastore de Hive

Si tu directorio de almacén de Hive está en Cloud Storage, deberías configurar un Metastore anulación de configuración. Esta anulación establece tu almacén de datos específico como el directorio de almacén predeterminado para Dataproc Metastore

Antes de configurar esta anulación, asegúrate de que tu servicio de Dataproc Metastore tiene permisos de lectura y escritura de objetos para acceder al directorio del almacén. Para obtener más información, consulta el directorio del almacén de Hive.

En las siguientes instrucciones, se muestra cómo actualizar una anulación de configuración de Hive Metastore.

Console

  1. En la consola de Google Cloud, abre la página de Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la página Dataproc Metastore, haz clic en el nombre del servicio de la el servicio que quieres actualizar.

    Se abrirá la página Detalle del servicio.

  3. En la pestaña Configuración, haz clic en Editar.

    Se abrirá la página Editar servicio.

  4. En Anulaciones de configuración de Metastore, ingresa lo siguiente:

    • Clave: Ingresa el siguiente valor: hive.metastore.warehouse.dir.
    • Valor: La ubicación en Cloud Storage de tu directorio de almacén. Por ejemplo: gs://my-bucket/path/to/location.
  5. Haz clic en Enviar.

    Regresa a la página Dataproc Metastore. verificarás que tu servicio se haya actualizado correctamente.

gcloud

  1. Para actualizar un servicio, ejecuta el siguiente comando gcloud metastore services update:

    gcloud metastore services update SERVICE \
        --location=LOCATION \
        --update-hive-metastore-configs="hive.metastore.warehouse.dir=CUSTOMER_DIR"
    

    Reemplaza lo siguiente:

    • SERVICE: Es el nombre de tu servicio de Dataproc Metastore.
    • LOCATION: Es la región de Google Cloud en la que reside tu servicio de Dataproc Metastore.
    • CUSTOMER_DIR: Es la ubicación de Cloud Storage del directorio del almacén. Por ejemplo: gs://my-bucket/path/to/location.
  2. Verifica que la actualización se haya realizado correctamente.

¿Qué sigue?