Ripristinare Dataproc Metastore da un backup

Questa pagina spiega come ripristinare un servizio Dataproc Metastore da un backup.

Un backup è uno snapshot delle impostazioni di configurazione e dei metadati archiviati in un servizio Dataproc Metastore. Puoi utilizzare la funzionalità di ripristino per configurare rapidamente un nuovo servizio Dataproc Metastore con i dati salvati in precedenza in un backup.

Prima di iniziare

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per ripristinare un servizio Dataproc Metastore da un backup, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questi ruoli predefiniti contengono le autorizzazioni necessarie per ripristinare un servizio Dataproc Metastore da un backup. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:

Autorizzazioni obbligatorie

Per ripristinare un servizio Dataproc Metastore da un backup, sono necessarie le seguenti autorizzazioni:

  • Per ripristinare un servizio di metadati: metastore.services.restore, metastore.backups.use
  • Per utilizzare l'oggetto Cloud Storage:
    • orgpolicy.policy.get
    • resourcemanager.projects.get
    • resourcemanager.projects.list
    • storage.managedFolders.create
    • storage.managedFolders.delete
    • storage.managedFolders.get
    • storage.managedFolders.list
    • storage.multipartUploads.*
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.restore
    • storage.objects.update

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Per ulteriori informazioni su ruoli e autorizzazioni specifici di Dataproc Metastore, consulta la panoramica di IAM di Dataproc Metastore.

Informazioni sul ripristino da un backup

Quando ripristini un servizio da un backup, puoi scegliere una delle seguenti opzioni:

  • Ripristina tutti i metadati e le impostazioni di configurazione salvate nel backup.
  • Ripristina tutti i metadati, ma non le impostazioni di configurazione salvate nel backup. Il servizio manterrà invece le impostazioni di configurazione correnti.

    Le impostazioni di configurazione includono i parametri di Dataproc Metastore, come il nome del servizio, il numero di porta e le impostazioni di rete. I metadati includono tutte le informazioni su database e tabelle archiviate in un servizio Dataproc Metastore.

Considerazioni

  • Mentre è in esecuzione un'operazione di ripristino, non puoi aggiornare il servizio, ad esempio non puoi modificare le impostazioni di configurazione. Tuttavia, puoi ancora utilizzare il servizio per le normali operazioni, ad esempio per accedere ai relativi metadati da cluster Dataproc o autogestiti collegati.

  • Le etichette Dataproc Metastore non vengono ripristinate.

  • I dati archiviati nella directory del magazzino non vengono ripristinati.

  • Il ripristino da un backup non ripristina né sostituisce i criteri IAM granulari.

  • Il ripristino da un backup pianificato richiede che il backup si trovi in un bucket Cloud Storage.

Ripristina da un backup

Per ripristinare un servizio Dataproc Metastore da un backup, completa i seguenti passaggi.

  • Se utilizzi la console Google Cloud, puoi ripristinare i metadati solo da un backup creato nello stesso progetto e nella stessa regione del nuovo servizio.

  • Se utilizzi Google Cloud CLI o le API Dataproc Metastore, puoi ripristinare i metadati da un backup creato in un progetto e in una regione diversi (backup tra servizi).

Console

  1. Nella console Google Cloud, apri la pagina Dataproc Metastore:

    Apri Dataproc Metastore

  2. Nella pagina Dataproc Metastore, fai clic sul nome del servizio che vuoi ripristinare da un backup.

    Viene visualizzata la pagina Dettagli del servizio.

    Pagina dei dettagli del servizio
    Figura 1. Pagina dei dettagli del servizio Dataproc Metastore
  3. Per visualizzare i backup, fai clic sulla scheda Backup/Ripristino.

  4. Seleziona il backup che vuoi utilizzare. Per farlo, fai clic sull'icona del menu e seleziona Ripristina.

    Viene visualizzata la pagina Ripristina.

    Puoi anche ripristinare il servizio nella pagina Dettagli del backup. A questo scopo, fai clic sul nome del backup e poi su Ripristina.

  5. Seleziona l'operazione di ripristino appropriata:

    • Ripristina i dati del metastore. Ripristina tutti i metadati, ma non le impostazioni di configurazione salvate nel backup
    • Ripristina i dati e la configurazione del servizio Metastore. Ripristina tutti i metadati e tutte le impostazioni di configurazione salvate nel backup.
  6. Per aggiornare il servizio, fai clic su Ripristina.

    Torna alla pagina Dataproc Metastore e verifica che il backup del servizio sia stato eseguito correttamente.

    Al termine del ripristino, Dataproc Metastore ritorna automaticamente allo stato attivo, indipendentemente dal fatto che il ripristino sia riuscito o meno.

Interfaccia a riga di comando gcloud

  1. Per ripristinare un servizio Dataproc Metastore, esegui il seguente comando gcloud metastore services restore:

    gcloud metastore services restore SERVICE  \
        --project=PROJECT_ID \
        --location=LOCATION \
        --backup=BACKUP \
        --restore-type=RESTORE_TYPE \
        --backup-location=BACKUP_LOCATION
    

    Sostituisci quanto segue:

    • SERVICE: il nome del servizio Dataproc Metastore.
    • PROJECT_ID: l'ID del progetto Google Cloud in cui si trova il servizio Dataproc Metastore.
    • LOCATION: la regione Google Cloud in cui risiede il servizio Dataproc Metastore.
    • BACKUP: facoltativo, l'identificatore del file di backup da cui stai eseguendo il ripristino. Questo valore può essere l'ID di backup, un URL completamente qualificato o il nome relativo nel seguente formato:projects/{project_id}/locations/{location_id}/services/{service_id}/backups/{backup_id}.
    • RESTORE_TYPE: il tipo di operazione di ripristino da eseguire. I valori accettati includono metadata-only o full. Il valore predefinito è metadata-only.
    • BACKUP_LOCATION: facoltativo. La posizione Cloud Storage del backup pianificato. Ad esempio: gs://my-bucket/path/to/location.
  2. Verifica che l'operazione di ripristino sia andata a buon fine.

    Al termine del ripristino, Dataproc Metastore ritorna automaticamente allo stato attivo, indipendentemente dal fatto che il ripristino sia riuscito o meno.

REST

Segui le istruzioni dell'API per ripristinare i metadati in un servizio utilizzando Explorer API.

Al termine del ripristino, Dataproc Metastore ritorna automaticamente allo stato attivo, indipendentemente dal fatto che il ripristino sia riuscito o meno.

Visualizzare la cronologia dei ripristini

Per visualizzare la cronologia dei ripristini di un servizio Dataproc Metastore nella console Google Cloud, segui questi passaggi:

  1. Nella console Google Cloud, apri la pagina Dataproc Metastore.
  2. Nella barra di navigazione, fai clic su Backup/Ripristino.

    La cronologia dei ripristini viene visualizzata in una tabella in Ripristina.

    La cronologia mostra fino agli ultimi 25 ripristini che hai completato.

    L'eliminazione di un servizio Dataproc Metastore comporta anche l'eliminazione di tutta la cronologia dei ripristini associati.

Risolvere i problemi comuni

Passaggi successivi