Ripristina Dataproc Metastore da un backup

Questa pagina spiega come ripristinare un servizio Dataproc Metastore da un backup.

Un backup è uno snapshot delle impostazioni di configurazione e dei metadati archiviati un servizio Dataproc Metastore. Puoi utilizzare la funzionalità di ripristino di configurare rapidamente un nuovo servizio Dataproc Metastore dati precedentemente salvati in un backup.

Prima di iniziare

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per ripristinare un servizio Dataproc Metastore da un backup, chiedi all'amministratore di concederti seguenti ruoli IAM:

  • Per concedere il controllo completo delle risorse Dataproc Metastore al fine di completare un backup, esegui una delle seguenti operazioni:
  • Per utilizzare l'oggetto Cloud Storage che archivia i backup pianificati: Utente oggetti Cloud Storage (roles/storage.objectUser) sull'agente di servizio Dataproc Metastore

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.

Questi ruoli predefiniti le autorizzazioni necessarie per ripristinare un servizio Dataproc Metastore da un backup. Per vedere le autorizzazioni esatte obbligatorie, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per ripristinare un servizio Dataproc Metastore da un backup, sono necessarie le seguenti autorizzazioni:

  • Per ripristinare un servizio di metadati: metastore.services.restore, metastore.backups.use
  • Per utilizzare l'oggetto Cloud Storage:
    • orgpolicy.policy.get
    • resourcemanager.projects.get
    • resourcemanager.projects.list
    • storage.managedFolders.create
    • storage.managedFolders.delete
    • storage.managedFolders.get
    • storage.managedFolders.list
    • storage.multipartUploads.*
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.restore
    • storage.objects.update

Potresti anche riuscire a ottenere queste autorizzazioni con ruoli personalizzati e altri ruoli predefiniti.

Per ulteriori informazioni su ruoli e autorizzazioni specifici di Dataproc Metastore, consulta la panoramica su IAM di Dataproc Metastore.

Informazioni sul ripristino da un backup

Quando ripristini un servizio da un backup, puoi scegliere una delle le seguenti opzioni:

  • Ripristina tutti i metadati e le impostazioni di configurazione salvate nel backup.
  • Ripristina tutti i metadati, ma non le impostazioni di configurazione salvate in il backup. Il servizio mantiene invece le impostazioni di configurazione correnti.

    Le impostazioni di configurazione includono i parametri di Dataproc Metastore come nome del servizio, numero di porta e impostazioni di rete. I metadati includono tutte le informazioni sul database e sulle tabelle archiviate in un Servizio Dataproc Metastore.

Considerazioni

  • Mentre è in corso un'operazione di ripristino, non puoi aggiornare di configurazione. Ad esempio, non è possibile modificare le impostazioni di configurazione. Tuttavia, può comunque utilizzare il servizio per le normali operazioni, ad esempio per accedere e i relativi metadati da Dataproc o da cluster autogestiti collegati.

  • Le etichette di Dataproc Metastore non vengono ripristinate.

  • I dati archiviati nella directory del warehouse non vengono ripristinati.

  • Il ripristino da un backup non ripristina né sostituisce la configurazione i criteri IAM.

  • Il ripristino da un backup pianificato richiede che il backup si trovi in una nel bucket Cloud Storage.

Ripristina da un backup

Per ripristinare un servizio Dataproc Metastore da un backup, completa i seguenti passaggi.

  • Se utilizzi la console Google Cloud, puoi ripristinare i metadati solo da un creato nello stesso progetto e nella stessa regione di il nuovo servizio.

  • Se usi le API Google Cloud CLI o Dataproc Metastore, puoi ripristinare i metadati da un backup creato in un progetto diverso regione (backup per più servizi).

Console

  1. Nella console Google Cloud, apri la pagina Dataproc Metastore:

    Apri Dataproc Metastore

  2. Nella pagina Dataproc Metastore, fai clic sul nome del servizio che vuoi ripristinare da un backup.

    Si apre la pagina Dettagli del servizio.

    Pagina dei dettagli del servizio
    Figura 1. Dataproc Metastore pagina dei dettagli del servizio
    .
  3. Per visualizzare le copie di backup, fai clic sulla scheda Backup/Ripristino.

  4. Seleziona il backup che vuoi utilizzare. A questo scopo, fai clic sull'icona del menu e seleziona Ripristina.

    Viene visualizzata la pagina Ripristina.

    Puoi anche ripristinare il servizio nella pagina Dettagli backup. Per farlo, fai clic sul nome del backup e quindi su Ripristina.

  5. Seleziona l'operazione di ripristino appropriata:

    • Ripristinare i dati del metastore. Ripristina tutti i metadati, ma non ripristina le impostazioni di configurazione salvate nel backup
    • Ripristinare i dati del metastore e la configurazione del servizio. Ripristina tutti i metadati e tutte le impostazioni di configurazione salvate nel backup.
  6. Per aggiornare il servizio, fai clic su Ripristina.

    Torna alla pagina Dataproc Metastore e e verificare di aver eseguito correttamente il backup del servizio.

    Al termine del ripristino, Dataproc Metastore torna automaticamente allo stato attivo, indipendentemente dal fatto che il ripristino non è riuscito.

Interfaccia a riga di comando gcloud

  1. Per ripristinare un servizio Dataproc Metastore, esegui il comando seguente comando gcloud metastore services restore:

    gcloud metastore services restore SERVICE  \
        --project=PROJECT_ID \
        --location=LOCATION \
        --backup=BACKUP \
        --restore-type=RESTORE_TYPE \
        --backup-location=BACKUP_LOCATION
    

    Sostituisci quanto segue:

    • SERVICE: il nome del tuo Servizio Dataproc Metastore.
    • PROJECT_ID: l'ID del progetto Google Cloud progetto in cui risiede il servizio Dataproc Metastore.
    • LOCATION: la regione Google Cloud in cui Il servizio Dataproc Metastore risiede.
    • BACKUP: facoltativo: l'identificatore del file di backup dal quale stai eseguendo il ripristino. Questo valore può essere l'ID backup, un indirizzo URL qualificato o il nome relativo nel seguente formato: projects/{project_id}/locations/{location_id}/services/{service_id}/backups/{backup_id}.
    • RESTORE_TYPE: il tipo di operazione di ripristino per l'esecuzione. I valori accettati includono metadata-only o full. Il valore predefinito è metadata-only.
    • BACKUP_LOCATION: (Facoltativo) Cloud Storage posizione del backup pianificato. Ad esempio: gs://my-bucket/path/to/location.
  2. Verifica che l'operazione di ripristino sia riuscita.

    Al termine del ripristino, Dataproc Metastore torna automaticamente allo stato attivo, indipendentemente dal fatto che il ripristino non è riuscito.

REST

Segui le istruzioni dell'API per ripristinare i metadati in un servizio utilizzando Explorer API.

Al termine del ripristino, Dataproc Metastore automaticamente torna allo stato attivo, indipendentemente dal fatto che il ripristino sia o meno riuscito.

Visualizza la cronologia del ripristino

Per visualizzare la cronologia del ripristino di un servizio Dataproc Metastore in nella console Google Cloud, completa i seguenti passaggi:

  1. Nella console della console Google Cloud, apri Dataproc Metastore .
  2. Nella barra di navigazione, fai clic su Backup/Ripristino.

    La cronologia del ripristino viene visualizzata in una tabella sotto Ripristina.

    La cronologia mostra fino agli ultimi 25 ripristini completati.

    L'eliminazione di un servizio Dataproc Metastore elimina anche tutti cronologia del ripristino associata.

Risolvere i problemi comuni

Passaggi successivi