Restablece Dataproc Metastore desde una copia de seguridad

En esta página, se explica cómo restablecer un servicio de Dataproc Metastore desde una copia de seguridad.

Una copia de seguridad es una instantánea de la configuración y los metadatos almacenados en un servicio de Dataproc Metastore. Puedes usar la función de restablecimiento para configurar con rapidez un servicio nuevo de Dataproc Metastore con los datos guardados previamente en una copia de seguridad.

Antes de comenzar

Funciones obligatorias

Si quieres obtener los permisos que necesitas para restablecer un servicio de Dataproc Metastore a partir de una copia de seguridad, pídele a tu administrador que te otorgue los siguientes roles de IAM:

  • Para otorgar el control total de los recursos de Dataproc Metastore para completar una copia de seguridad, puedes elegir una de las siguientes opciones:
  • Para usar el objeto de Cloud Storage que almacena las copias de seguridad programadas, haz lo siguiente: Usuario del objeto de Cloud Storage (roles/storage.objectUser) en el agente de servicio de Dataproc Metastore

Si quieres obtener más información para otorgar funciones, consulta Administra el acceso.

Estos roles predefinidos contienen los permisos necesarios para restablecer un servicio de Dataproc Metastore desde una copia de seguridad. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para restablecer un servicio de Dataproc Metastore a partir de una copia de seguridad:

  • Para restablecer un servicio de metadatos: metastore.services.restore, metastore.backups.use
  • Para usar el objeto de Cloud Storage, haz lo siguiente:
    • orgpolicy.policy.get
    • resourcemanager.projects.get
    • resourcemanager.projects.list
    • storage.managedFolders.create
    • storage.managedFolders.delete
    • storage.managedFolders.get
    • storage.managedFolders.list
    • storage.multipartUploads.*
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.restore
    • storage.objects.update

Es posible que también puedas obtener estos permisos con funciones personalizadas o con otras funciones predefinidas.

Para obtener más información sobre las funciones y los permisos específicos de Dataproc Metastore, consulta Descripción general de IAM de Dataproc Metastore.

Información acerca del restablecimiento desde una copia de seguridad

Cuando restableces un servicio a partir de una copia de seguridad, puedes elegir una de las siguientes opciones:

  • Restablece todos los metadatos y los parámetros de configuración guardados en la copia de seguridad.
  • Restablece todos los metadatos, pero no restablece la configuración guardada en la copia de seguridad. En cambio, el servicio conservará los parámetros de configuración actuales.

    Los parámetros de configuración incluyen parámetros de Dataproc Metastore, como el nombre del servicio, el número de puerto y la configuración de red. En los metadatos se incluye toda la información de tablas y bases de datos almacenada en un servicio de Dataproc Metastore.

Consideraciones

  • Mientras se ejecuta una operación de restablecimiento, no puedes actualizar tu servicio. Por ejemplo, no puedes cambiar los parámetros de configuración. Sin embargo, puedes usar tu servicio para operaciones normales, como usarlo para acceder a sus metadatos desde Dataproc conectado o clústeres autoadministrados.

  • Las etiquetas de Dataproc Metastore no se restablecen.

  • Los datos almacenados en el directorio del almacén no se restablecen.

  • El restablecimiento desde una copia de seguridad no restablece ni reemplaza las políticas de IAM detalladas.

  • Para restablecer desde una copia de seguridad programada, es necesario que la copia de seguridad se ubique en un bucket de Cloud Storage.

Restablecer copia de seguridad

Para restablecer un servicio de Dataproc Metastore desde una copia de seguridad, completa los siguientes pasos.

  • Si usas la consola de Google Cloud, solo puedes restablecer los metadatos desde una copia de seguridad que se creó en el mismo proyecto y la misma región que tu servicio nuevo.

  • Si usas las APIs de Google Cloud CLI o Dataproc Metastore, puedes restablecer los metadatos desde una copia de seguridad creada en un proyecto y una región diferentes (copia de seguridad entre servicios).

Console

  1. En la consola de Google Cloud, abre la página de Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la página Dataproc Metastore, haz clic en el nombre del servicio que deseas restablecer desde una copia de seguridad.

    Se abrirá la página Detalles del servicio.

    Página de detalles del servicio
    Figura 1: La página de detalles del servicio de Dataproc Metastore
  3. Para ver tus copias de seguridad, haz clic en la pestaña Copia de seguridad/Restablecer.

  4. Selecciona la copia de seguridad que quieras usar. Para ello, haz clic en el ícono de menú y selecciona Restablecer.

    Se abrirá la página Restablecer.

    También puedes restablecer el servicio en la página Detalles de la copia de seguridad. Para ello, haz clic en el nombre de la copia de seguridad y, luego, en Restablecer.

  5. Selecciona la operación de restablecimiento adecuada:

    • Restablece los datos del almacén de metadatos. Restablece todos los metadatos, pero no restablece los parámetros de configuración guardados en la copia de seguridad
    • Restablece los datos del almacén de metadatos y la configuración del servicio. Restablece todos los metadatos y todos los parámetros de configuración guardados en la copia de seguridad.
  6. Para actualizar el servicio, haz clic en Restablecer.

    Regresa a la página de Dataproc Metastore y verifica que se haya creado una copia de seguridad de tu servicio de forma correcta.

    Cuando se completa el restablecimiento, Dataproc Metastore vuelve al estado activo de forma automática, sin importar si el restablecimiento se realizó correctamente o no.

gcloud CLI

  1. Para restablecer un servicio de Dataproc Metastore, ejecuta el siguiente comando gcloud metastore services restore:

    gcloud metastore services restore SERVICE  \
        --project=PROJECT_ID \
        --location=LOCATION \
        --backup=BACKUP \
        --restore-type=RESTORE_TYPE \
        --backup-location=BACKUP_LOCATION
    

    Reemplaza lo siguiente:

    • SERVICE: Es el nombre de tu servicio de Dataproc Metastore.
    • PROJECT_ID: Es el ID del proyecto de Google Cloud en el que reside tu servicio de Dataproc Metastoreservice.
    • LOCATION: Es la región de Google Cloud en la que reside el servicio de Dataproc Metastore.
    • BACKUP: Es el identificador del archivo de copia de seguridad desde el que realizas el restablecimiento. Este valor puede ser el ID de copia de seguridad, una URL completamente calificada o el nombre relativo en el siguiente formato: projects/{project_id}/locations/{location_id}/services/{service_id}/backups/{backup_id}.
    • RESTORE_TYPE: Es el tipo de operación de restablecimiento que se realizará. Los valores aceptados son metadata-only o full. El valor predeterminado es metadata-only.
    • BACKUP_LOCATION: Es la ubicación en Cloud Storage de la copia de seguridad programada (opcional). Por ejemplo: gs://my-bucket/path/to/location.
  2. Verifica que la operación de restablecimiento se haya realizado correctamente.

    Cuando se completa el restablecimiento, Dataproc Metastore vuelve al estado activo de forma automática, sin importar si el restablecimiento se realizó correctamente o no.

REST

Sigue las instrucciones de la API para restablecer los metadatos en un servicio con el Explorador de APIs.

Cuando se completa el restablecimiento, Dataproc Metastore vuelve al estado activo de forma automática, sin importar si el restablecimiento se realizó correctamente o no.

Ver historial de restablecimiento

Para ver el historial de restablecimiento de un servicio de Dataproc Metastore en la consola de Google Cloud, completa los siguientes pasos:

  1. En la consola de Google Cloud, abre la página Dataproc Metastore.
  2. En la barra de navegación, haz clic en Backup/Restore.

    El historial de restablecimiento aparecerá en una tabla en Restablecer.

    En el historial, se muestran los últimos 25 restablecimientos que realizaste.

    Si borras un servicio de Dataproc Metastore, también se borrará todo el historial de restablecimiento asociado.

Soluciona los problemas comunes.

¿Qué sigue?