Actualizar un servicio de Dataproc Metastore

En esta página, se explica cómo actualizar un servicio de Dataproc Metastore.

Puedes actualizar tu servicio de Dataproc Metastore para cambiar los parámetros de configuración, o para habilitar o inhabilitar funciones opcionales.

Antes de comenzar

Roles obligatorios

Para obtener el permiso que necesitas para actualizar un servicio de Dataproc Metastore, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto, según el principio de privilegio mínimo:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.

Esta función predefinida contiene el permiso metastore.services.update, que se necesita para actualizar un servicio de Dataproc Metastore.

Es posible que también puedas obtener este permiso con funciones personalizadas o con otras funciones predefinidas.

Para obtener más información sobre las funciones y los permisos específicos de Dataproc Metastore, consulta Descripción general de IAM de Dataproc Metastore.

Acerca de la actualización de un servicio

Puedes actualizar los siguientes parámetros de Dataproc Metastore.

  • Número de puerto. Actualiza el número de puerto TCP de la interfaz de Apache Thrift.
  • Nivel de servicio. Alternar entre el nivel de servicio de Desarrollador o el nivel de servicio de Enterprise. Estos niveles influyen en la capacidad del servicio.
  • Sincronización de Data Catalog: Activa o desactiva la función de sincronización de Data Catalog.
  • Período de mantenimiento. Cambia la frecuencia del período de mantenimiento, incluidos el Día de la semana y la Hora del día.
  • Kerberos. Habilita o inhabilita la autenticación de Kerberos. Si estaba habilitada anteriormente, puede actualizar sus archivos de configuración de Kerberos.
  • Configuraciones de almacén de metadatos de Hive Actualiza la ubicación de tu directorio de almacén de Hive.
  • Configuración de la versión auxiliar Habilita, inhabilita o agrega versiones auxiliares adicionales.
  • Etiquetas. Agrega o quita etiquetas opcionales que describan los metadatos.

Actualizar un servicio

Antes de ejecutar una actualización, ten en cuenta las siguientes consideraciones:

  • Solo puedes ejecutar un trabajo de actualización a la vez (para cada servicio de Dataproc Metastore).
  • Puedes actualizar varios parámetros en un solo trabajo de actualización.
  • Puede seguir usando Dataproc Metastore mientras se actualiza.

Cuando la actualización se realiza correctamente, Dataproc Metastore ingresa automáticamente en un estado active. Si la actualización falla, el servicio de Dataproc Metastore revierte a su estado anterior.

En las siguientes instrucciones, se muestra cómo actualizar un servicio de Dataproc Metastore.

Consola

  1. En Google Cloud Console, abre la página Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la página de Dataproc Metastore, haz clic en el nombre del servicio que deseas actualizar.

    Se abrirá la página Detalles del servicio.

    Página de detalles del servicio
  3. En la pestaña Configuración, haz clic en Editar.

    Se abrirá la página Editar servicio.

  4. Elige los valores que deseas actualizar para tu servicio.

  5. Haz clic en Enviar.

    Regrese a la página de Dataproc Metastore y verifique que su servicio se haya actualizado correctamente.

CLI de gcloud

  1. Para actualizar un servicio, ejecuta el siguiente comando gcloud metastore services update:

    gcloud metastore services update SERVICE \
        --location=LOCATION \
        --port=PORT \
        --tier=TIER \
        --maintenance-window-day=MAINTENANCE_WINDOW_DAY \
        --maintenance-window-hour=MAINTENANCE_WINDOW_HOUR \
        --kerberos_principal=KERBEROS_PRINCIPAL \
        --keytab=KEYTAB \
        --krb5-config=KRB5_CONFIG \
        --update-hive-metastore-configs-from-file=[KEY=VALUE, ...] \
        --clear-hive-metastore-configs \
        --remove-hive-metastore-configs=[KEY, ...] \
        --update-labels=[KEY=VALUE, ...] \
        --clear-labels \
        --remove-labels=[KEY, ...]
    

    Reemplaza lo siguiente:

    • SERVICE: Es el nombre de tu servicio de Dataproc Metastore.
    • LOCATION: Es la región de Google Cloud en la que se encuentra el servicio de Dataproc Metastore.
    • PORT: Es el puerto TCP de la interfaz de Thrift que usas con el servicio de Dataproc Metastore.
    • TIER: Es la capacidad de nivel del servicio de Dataproc Metastore (opcional).
    • MAINTENANCE_WINDOW_DAY: Es el día de la semana en que comienza el período de servicio.
    • MAINTENANCE_WINDOW_HOUR: Es la hora del día en la que comienza el período de servicio.
    • KERBEROS_PRINCIPAL: Es un principal de Kerberos que existe en la tecla key y en el KDC. Una principal típica tiene el formato “principal/instancia@REALM”, pero no hay un formato exacto.
    • KEYTAB: Es un archivo de pestañas de Kerberos que se usa para autenticar una principal de servicio con un Centro de distribución de claves de Kerberos (opcional).
    • KRB5_CONFIG: (Opcional) El archivo krb5.config especifica el KDC y la información del dominio de Kerberos, que incluye ubicaciones del KDC y configuraciones predeterminadas para las aplicaciones de Kerberos y el dominio.
    • [KEY, ...]: Son los parámetros de configuración del almacén de metadatos de Hive que quieres actualizar (opcional). Si existe una variable en este campo, se actualiza su valor. De lo contrario, se creará una nueva variable. Si se establece esta marca, -clear-hive-metastore-configs también se configura automáticamente.
    • [KEY, ...]: Son los parámetros de configuración del almacén de metadatos de Hive que deseas quitar (opcional).
    • [KEY=VALUE, ...]: Son las configuraciones o los parámetros de configuración de pares clave-valor de Hive que deseas actualizar (opcional).
    • [KEY, ...]: Son las etiquetas o las opciones de configuración del par clave-valor de Hive que deseas quitar.
  2. Verifica que la actualización se haya realizado correctamente.

REST

Sigue las instrucciones de la API para actualizar un servicio mediante el Explorador de API.

Actualiza la configuración del almacén de metadatos de Hive

Si el directorio de tu almacén de Hive está en Cloud Storage, debes establecer una anulación de configuración de Metastore. Esta anulación establece tu almacén de datos específico como el directorio de almacén predeterminado para Dataproc Metastore.

Antes de configurar esta anulación, asegúrate de que tu servicio de Dataproc Metastore tenga permisos de lectura y escritura de objetos para acceder al directorio del almacén. Para obtener más información, consulta el directorio de almacenes de Hive.

En las siguientes instrucciones, se muestra cómo actualizar una anulación de configuración de Hive Metastore.

Consola

  1. En la consola de Google Cloud, abre la página de Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la página de Dataproc Metastore, haz clic en el nombre del servicio que deseas actualizar.

    Se abrirá la página Detalles del servicio.

  3. En la pestaña Configuración, haz clic en Editar.

    Se abrirá la página Editar servicio.

  4. En Anulaciones de configuración de Metastore, ingresa lo siguiente:

    • Clave: Ingresa el siguiente valor: hive.metastore.warehouse.dir.
    • Valor: La ubicación de Cloud Storage del directorio de tu almacén. Por ejemplo: gs://my-bucket/path/to/location
  5. Haz clic en Enviar.

    Regrese a la página de Dataproc Metastore y verifique que su servicio se haya actualizado correctamente.

gcloud

  1. Para actualizar un servicio, ejecuta el siguiente comando de gcloud metastore services update:

    gcloud metastore services update SERVICE \
        --location=LOCATION \
        --update-hive-metastore-configs="hive.metastore.warehouse.dir=CUSTOMER_DIR"
    

    Reemplaza lo siguiente:

    • SERVICE: Es el nombre de tu servicio de Dataproc Metastore.
    • LOCATION: Es la región de Google Cloud en la que se encuentra el servicio de Dataproc Metastore.
    • CUSTOMER_DIR: Es la ubicación de Cloud Storage del directorio de tu almacén. Por ejemplo: gs://my-bucket/path/to/location
  2. Verifica que la actualización se haya realizado correctamente.

¿Qué sigue?