Restablece Dataproc Metastore a partir de una copia de seguridad

En esta página, se explica cómo restablecer un servicio de Dataproc Metastore a partir de una copia de seguridad.

Una copia de seguridad es una instantánea de la configuración y los metadatos almacenados en un servicio de Dataproc Metastore. Puedes usar la función de restablecimiento para configurar rápidamente un nuevo servicio de Dataproc Metastore con los datos que se guardaron anteriormente en una copia de seguridad.

Antes de comenzar

Roles obligatorios

Para obtener los permisos que necesitas para restablecer un servicio de Metastore de Dataproc desde una copia de seguridad, pídele a tu administrador que te otorgue los siguientes roles de IAM:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Estos roles predefinidos contienen los permisos necesarios para restablecer un servicio de Metastore de Dataproc desde una copia de seguridad. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para restablecer un servicio de Dataproc Metastore desde una copia de seguridad:

  • Para restablecer un servicio de metadatos, haz lo siguiente: metastore.services.restore, metastore.backups.use
  • Para usar el objeto de Cloud Storage, sigue estos pasos:
    • orgpolicy.policy.get
    • resourcemanager.projects.get
    • resourcemanager.projects.list
    • storage.managedFolders.create
    • storage.managedFolders.delete
    • storage.managedFolders.get
    • storage.managedFolders.list
    • storage.multipartUploads.*
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.restore
    • storage.objects.update

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Para obtener más información sobre los roles y permisos específicos de Dataproc Metastore, consulta Descripción general de la IAM de Dataproc Metastore.

Acerca del restablecimiento a partir de una copia de seguridad

Cuando restableces un servicio desde una copia de seguridad, puedes elegir una de las siguientes opciones: las siguientes opciones:

  • Restablece todos los metadatos y los ajustes de configuración guardados en la copia de seguridad.
  • Restablece todos los metadatos, pero no restableces la configuración guardada en la copia de seguridad. En su lugar, tu servicio retiene la configuración actual.

    Los parámetros de configuración incluyen parámetros de Dataproc Metastore como el nombre del servicio, el número de puerto y la configuración de red. Los metadatos incluyen toda la información de la base de datos y la tabla almacenada en un servicio de Dataproc Metastore.

Consideraciones

  • Mientras se ejecuta una operación de restablecimiento, no puedes actualizar tu servicio. Por ejemplo, no puedes cambiar los parámetros de configuración. Sin embargo, puedes seguir usando tu servicio para operaciones normales, como acceder a sus metadatos desde Dataproc conectado o clústeres administrados por el cliente.

  • Las etiquetas de Dataproc Metastore no se restablecen.

  • Los datos almacenados en el directorio del almacén no se restablecen.

  • Restablecer desde una copia de seguridad no restablece ni reemplaza políticas de IAM.

  • Para restablecer desde una copia de seguridad programada, esta debe estar ubicada en un bucket de Cloud Storage.

Restablecer copia de seguridad

Para restablecer un servicio de Dataproc Metastore a partir de una copia de seguridad, completa los siguientes pasos.

  • Si usas la consola de Google Cloud, solo puedes restablecer metadatos desde una copia de seguridad que se creó en el mismo proyecto y región que tu servicio nuevo.

  • Si usas Google Cloud CLI o las APIs de Dataproc Metastore, puedes restablecer metadatos de una copia de seguridad creada en otro proyecto región (copia de seguridad entre servicios).

Console

  1. En la consola de Google Cloud, abre la página Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la página Dataproc Metastore, haz clic en el nombre del servicio que quieres restablecer desde una copia de seguridad.

    Se abrirá la página Detalle del servicio.

    Página de detalles del servicio
    Figura 1: Dataproc Metastore página de detalles del servicio
  3. Para ver tus copias de seguridad, haz clic en la pestaña Copia de seguridad/restablecimiento.

  4. Selecciona la copia de seguridad que deseas usar. Para ello, haz clic en el ícono de menú y selecciona Restablecer.

    Se abrirá la página Restablecer.

    También puedes restablecer el servicio en la página Detalles de la copia de seguridad. Para ello, haz clic en el nombre de la copia de seguridad y, luego, en Restablecer.

  5. Selecciona la operación de restablecimiento adecuada:

    • Restablece los datos del almacén de metadatos. Restablece todos los metadatos, pero no los parámetros de configuración guardados en la copia de seguridad.
    • Restablece los datos del almacén de metadatos y la configuración del servicio. Restablece todos los metadatos y todos los parámetros de configuración guardados en la c copia de seguridad.
  6. Para actualizar el servicio, haz clic en Restablecer.

    Regresa a la página Dataproc Metastore. verificarás que se haya creado correctamente una copia de seguridad de tu servicio.

    Cuando se completa el restablecimiento, Dataproc Metastore regresa automáticamente al estado activo sin importar si no se realizó correctamente el restablecimiento.

gcloud CLI

  1. Para restablecer un servicio de Dataproc Metastore, ejecuta el siguiente comando: siguiente comando gcloud metastore services restore:

    gcloud metastore services restore SERVICE  \
        --project=PROJECT_ID \
        --location=LOCATION \
        --backup=BACKUP \
        --restore-type=RESTORE_TYPE \
        --backup-location=BACKUP_LOCATION
    

    Reemplaza lo siguiente:

    • SERVICE: Es el nombre de tu servicio de Dataproc Metastore.
    • PROJECT_ID: Es el ID del proyecto de la biblioteca cliente de Google Cloud. proyecto en el que reside el Dataproc Metastoreservice.
    • LOCATION: Es la región de Google Cloud a la que reside el servicio de Dataproc Metastore.
    • BACKUP: Opcional: Es el identificador del archivo de copia de seguridad desde el que se restablece. Este valor puede ser el ID de la copia de seguridad, una URL completamente calificada o el nombre relativo en el siguiente formato: projects/{project_id}/locations/{location_id}/services/{service_id}/backups/{backup_id}.
    • RESTORE_TYPE: Es el tipo de operación de restablecimiento que se debe realizar. Los valores aceptados incluyen metadata-only o full. El valor predeterminado es metadata-only.
    • BACKUP_LOCATION: Es opcional. Es la ubicación de Cloud Storage de la copia de seguridad programada. Por ejemplo: gs://my-bucket/path/to/location.
  2. Verifica que la operación de restablecimiento se haya realizado correctamente.

    Cuando se completa el restablecimiento, Dataproc Metastore vuelve automáticamente al estado activo, independientemente de si el restablecimiento se realizó correctamente o no.

REST

Sigue las instrucciones de la API para restablecer los metadatos en un servicio. con el Explorador de APIs.

Cuando se completa el restablecimiento, Dataproc Metastore automáticamente regresa al estado activo independientemente de si el restablecimiento sin errores.

Cómo ver el historial de restablecimientos

Para ver el historial de restablecimiento de un servicio de Dataproc Metastore, sigue estos pasos: la consola de Google Cloud, completa los siguientes pasos:

  1. En la consola de Google Cloud, abre Dataproc Metastore. .
  2. En la barra de navegación, haz clic en Backup/Restore.

    El historial de restablecimiento aparece en una tabla en Restablecer.

    El historial muestra hasta los últimos 25 restablecimientos que realizaste.

    Borrar un servicio de Dataproc Metastore también borra todos el historial de restablecimiento asociado.

Soluciona los problemas comunes.

¿Qué sigue?