Questa pagina spiega come creare un backup di un servizio Dataproc Metastore.
Un backup scatta uno snapshot dei tuoi salva le impostazioni di configurazione attuali e tutti i metadati archiviati.
Dopo aver creato un backup, puoi utilizzare la funzionalità Ripristina da un backup per completare un nuovo servizio Dataproc Metastore con i dati salvati nell'istantanea.
Prima di iniziare
- Attiva Dataproc Metastore nel tuo progetto.
- Crea un servizio Dataproc Metastore.
- (Facoltativo) Importare i metadati in Dataproc Metastore.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per il backup di un servizio Dataproc Metastore, chiedi all'amministratore di concederti seguenti ruoli IAM:
-
Per concedere il controllo completo delle risorse Dataproc Metastore al fine di completare un backup, esegui una delle seguenti operazioni:
-
Editor Dataproc Metastore (
roles/metastore.editor
) sul servizio di metadati. -
Amministratore Dataproc Metastore (
roles/metastore.admin
) del progetto.
-
Editor Dataproc Metastore (
-
Per concedere l'accesso in lettura e modifica a metadati specifici di database e tabelle:
Operatore metadati Dataproc Metastore (
roles/metastore.metadataOperator
) sul servizio di metadati -
Per utilizzare l'oggetto Cloud Storage che archivia i backup pianificati:
Utente dell'oggetto Cloud Storage (
roles/storage.objectUser
) nell'agente del servizio Dataproc Metastore
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti le autorizzazioni necessarie per eseguire il backup di un servizio Dataproc Metastore. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:
Autorizzazioni obbligatorie
Per eseguire il backup di un servizio Dataproc Metastore sono necessarie le seguenti autorizzazioni:
-
Per eseguire il backup di un servizio di metadati:
metastore.backups.create
-
Per utilizzare l'oggetto Cloud Storage:
-
orgpolicy.policy.get
-
resourcemanager.projects.get
-
resourcemanager.projects.list
-
storage.managedFolders.create
-
storage.managedFolders.delete
-
storage.managedFolders.get
-
storage.managedFolders.list
-
storage.multipartUploads.*
-
storage.objects.create
-
storage.objects.delete
-
storage.objects.get
-
storage.objects.list
-
storage.objects.restore
-
storage.objects.update
-
Potresti anche riuscire a ottenere queste autorizzazioni con ruoli personalizzati altri ruoli predefiniti.
Per ulteriori informazioni su ruoli e autorizzazioni specifici di Dataproc Metastore, consulta la panoramica su IAM di Dataproc Metastore.Considerazioni sul backup
Prima di eseguire un'operazione di backup, tieni presente quanto segue:
- Per ogni servizio Dataproc Metastore, puoi creare e archiviare fino a sette backup alla volta. Se tenti di superare le sette copie di backup, processo non riuscito. Se vuoi creare un altro backup, devi prima manualmente uno dei file di backup archiviati.
- Mentre è in corso un'operazione di backup, non puoi aggiornare Servizio Dataproc Metastore, ad esempio, non è possibile modificare le impostazioni di configurazione. Tuttavia, puoi comunque utilizzare il servizio per le normali operazioni, come l'accesso ai metadati da Dataproc collegato e cluster autogestiti.
- Puoi creare backup pianificati che vengono eseguiti a vari intervalli di cron, ad esempio ogni giorno.
Crea backup
Per eseguire il backup di un servizio Dataproc Metastore, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud, apri la pagina Dataproc Metastore:
Nella pagina Dataproc Metastore, fai clic sul nome del servizio di cui vuoi eseguire il backup.
Viene visualizzata la pagina Dettagli del servizio.
Nella parte superiore della pagina, fai clic su Backup.
Si apre la pagina Backup.
Inserisci il nome del backup.
(Facoltativo) Inserisci una Descrizione del backup.
Per avviare l'operazione di backup, fai clic su Backup.
Torna alla pagina Dataproc Metastore e verifica che il backup del servizio sia stato eseguito correttamente.
Al termine del backup, Dataproc Metastore torna automaticamente allo stato attivo, indipendentemente dal fatto che il backup non è riuscito.
Interfaccia a riga di comando gcloud
Per eseguire il backup di un servizio Dataproc Metastore, esegui il seguente comando
gcloud metastore services backups create
:gcloud metastore services backups create BACKUP \ --location=LOCATION \ --service=SERVICE \ --description=DESCRIPTION
Sostituisci quanto segue:
BACKUP
: ID o codice completo per il backup.LOCATION
: la regione Google Cloud in cui risiede il servizio Dataproc Metastore.SERVICE
: il nome del servizio Dataproc Metastore.DESCRIPTION
: una descrizione del backup.
Verifica che il backup del servizio sia stato eseguito correttamente.
Al termine del backup, Dataproc Metastore torna automaticamente allo stato attivo, indipendentemente dal fatto che il backup è riuscito.
REST
Segui le istruzioni dell'API per eseguire il backup dei metadati di un servizio utilizzando Explorer API.
Al termine del backup, Dataproc Metastore ritorna automaticamente allo stato attivo, indipendentemente dal fatto che il backup sia riuscito o meno.
Visualizza la cronologia dei backup
Visualizzazione della cronologia dei backup di un servizio Dataproc Metastore nella console Google Cloud, completa i seguenti passaggi:
- Nella console della console Google Cloud, apri Dataproc Metastore .
Nella barra di navigazione, fai clic su Backup/Ripristino.
La cronologia dei backup viene visualizzata in una tabella in Backup.
La cronologia mostra fino agli ultimi 7 backup.
L'eliminazione di un servizio Dataproc Metastore elimina anche tutti cronologia dei backup associata.
Eliminare un backup
Per eliminare un backup di Dataproc Metastore nella console Google Cloud, completa i seguenti passaggi:
- Nella console Google Cloud, apri Dataproc Metastore .
- Nella barra di navigazione, fai clic su Backup/Ripristino.
- Individua il backup che vuoi eliminare e fai clic sul pulsante delle impostazioni.
- Fai clic su Elimina.
Pianificare un backup
I backup possono essere pianificati per essere eseguiti nel cron job specificato dall'utente intervalli, tra cui la corsa giornaliera, settimanale o mensile. Una pianificazione cron utilizza il formato di stringa unix-cron (* * * * *), un insieme di cinque campi in una riga che indica quando il job eseguire il deployment.
Ad esempio, puoi impostare un intervallo personalizzato per creare un backup ogni settimana, come ogni mercoledì alle 14:00 PST.
Considerazioni sul backup pianificato
- Per i backup pianificati è necessario specificare una posizione di backup, che deve essere un percorso Cloud Storage.
- I backup pianificati vengono sempre creati nel formato file Avro.
- Per impostazione predefinita, i backup pianificati sono configurati nel fuso orario UTC. Puoi Modificare il fuso orario quando crei il backup per la prima volta.
- I backup pianificati possono essere impostati in modo da essere eseguiti a intervalli orari, giornalieri, settimanali o mensili. L'intervallo orario minimo che puoi impostare è di 4 ore.
Creare un backup pianificato
Le pianificazioni dei backup possono essere impostate quando crei il servizio per la prima volta o aggiunte in un secondo momento quando aggiorni il servizio.
Per creare un servizio Dataproc Metastore 2 con un backup pianificato, completa la procedura in una delle seguenti schede:
Console
Nella console Google Cloud, apri la pagina Dataproc Metastore.
Nella parte superiore della pagina Dataproc Metastore, fai clic sul pulsante Crea.
Viene visualizzata la pagina Crea servizio.
Seleziona Dataproc Metastore 2.
In Backup pianificati, imposta il pulsante di attivazione/disattivazione su Attiva.
In Posizione, seleziona la posizione di Cloud Storage in cui vuoi archiviare il backup pianificato.
(Facoltativo) Nella programmazione, seleziona quanto segue:
- Per Si ripete, seleziona la ricorrenza, ad esempio Ogni giorno. o Settimanalmente.
- Per All'ora, seleziona l'ora della ripetizione, ad esempio 00:00.
- Per Fuso orario, seleziona il fuso orario appropriato, ad esempio UTC-8.
Per le restanti opzioni di configurazione del servizio, utilizza i valori predefiniti.
Fai clic su Invia.
Interfaccia a riga di comando gcloud
Per pianificare un backup di un servizio Dataproc Metastore, esegui questo
gcloud metastore services backups create
:gcloud metastore services create SERVICE \ --location=LOCATION \ --enable-scheduled-backup \ --scheduled-backup-cron=SCHEDULED_BACKUP_CRON \ --scheduled-backup-location=SCHEDULED_BACKUP_LOCATION
Sostituisci quanto segue:
SERVICE
: l'ID o l'identificatore completo per il backup.LOCATION
: la regione Google Cloud in cui risiede il servizio Dataproc Metastore.SCHEDULED_BACKUP_CRON
: la frequenza del backup, specificata nel formato dell'ora CRON. Ad esempio, un valore cron di0 0 * * *
pianifica una pianificazione giornaliera backup.SCHEDULED_BACKUP_LOCATION
: il Percorso Cloud Storage del tuo backup. Ad esempio:gs://my-bucket/path/to/location
.
o
Puoi anche pianificare un backup archiviando i valori precedenti in un di configurazione del deployment:
gcloud metastore services create SERVICE \ --location=LOCATION \ --scheduled-backup-configs-from-file=SCHEDULED_BACKUP_CONFIGS_FROM_FILE
Sostituisci quanto segue:
SCHEDULED_BACKUP_CONFIGS_FROM_FILE
: un percorso verso un file JSON contenente i valori di configurazione del backupenabled
,cront_schedule
,time_zone
ebackup_location
.
L'esempio seguente mostra un file di configurazione del backup che attiva i backup pianificati, imposta la pianificazione del backup su ogni ora, specifica il fuso orario come PST e definisce la posizione del backup come un bucket Cloud Storage. Puoi scegliere i fusi orari dall'elenco dei fusi orari del database tz comuni.
{ "enabled": true, "cron_schedule": "0 0 * * *", "time_zone": "PST", "backup_location": "gs://my-bucket/path/to/location" }
REST
Segui le istruzioni dell'API per creare un backup pianificato utilizzando Explorer API.
Aggiornare un backup pianificato
Per aggiornare un servizio Dataproc Metastore 2 configurato con un backup pianificato, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud, apri la pagina Dataproc Metastore.
Nella pagina Dataproc Metastore, fai clic sul nome del servizio per cui vuoi pianificare un backup.
In Backup pianificati, imposta il pulsante di attivazione/disattivazione su Abilitati.
In Posizione, seleziona la posizione di Cloud Storage in cui vuoi archiviare il backup pianificato.
(Facoltativo) In Pianifica, seleziona i valori per i seguenti campi:
- In Si ripete, seleziona la ricorrenza, ad esempio Ogni giorno o Ogni settimana.
- Per All'ora, seleziona l'ora della ripetizione, ad esempio 00:00.
- In Fuso orario, seleziona il fuso orario appropriato, ad esempio UTC-8.
Interfaccia a riga di comando gcloud
Per pianificare un backup di un servizio Dataproc Metastore, esegui il seguente comando
gcloud metastore services backups update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --enable-scheduled-backup \ --scheduled-backup-cron=SCHEDULED_BACKUP_CRON \ --scheduled-backup-location=SCHEDULED_BACKUP_LOCATION \
Sostituisci quanto segue:
SERVICE
: l'ID o l'identificatore completo per il backup pianificato.LOCATION
: la regione Google Cloud in cui risiede il servizio Dataproc Metastore.SCHEDULED_BACKUP_CRON
: la frequenza del backup, specificato nel formato dell'ora cron. Ad esempio, un valore cron di0 0 * * *
pianifica una pianificazione giornaliera backup.SCHEDULED_BACKUP_LOCATION
: il cloud storage posizione del backup pianificato. Ad esempio:gs://my-bucket/path/to/location
.
Puoi anche aggiornare un backup pianificato utilizzando i valori precedenti archiviati in un file di configurazione:
gcloud metastore services update SERVICE \ --location=LOCATION \ --scheduled-backup-configs-from-file=SCHEDULED_BACKUP_CONFIGS_FROM_FILE
Sostituisci quanto segue:
SCHEDULED_BACKUP_CONFIGS_FROM_FILE
: un percorso verso un file JSON contenente la configurazione del backup.
L'esempio seguente mostra un file di configurazione di backup che disattiva un backup pianificato.
{ "enabled": false, }
REST
Segui le istruzioni dell'API per aggiornare un backup pianificato utilizzando Explorer API.
Visualizzare un backup pianificato
Per visualizzare un servizio Dataproc Metastore 2 configurato con un backup pianificato, completa i passaggi in una delle seguenti schede:
Console
Nella console Google Cloud, apri la pagina Dataproc Metastore.
Nella parte superiore della pagina, fai clic su Backup.
Viene visualizzata la pagina Backup, che mostra i backup pianificati. Tieni presente che i backup sono archiviati nel bucket Cloud Storage indicato nella configurazione del backup pianificato.
Interfaccia a riga di comando gcloud
Esegui questo comando
gcloud storage ls
:gcloud storage ls gs://BUCKET_NAME/SERVICE/LOCATION
Sostituisci quanto segue:
BUCKET_NAME
: il percorso di Cloud Storage in cui è archiviato il backup pianificato che vuoi visualizzare.SERVICE
: l'ID o l'identificatore completo per il backup pianificato.LOCATION
: la regione Google Cloud in cui risiede il servizio Dataproc Metastore.
REST
Segui le istruzioni dell'API per visualizzare un backup pianificato utilizzando Explorer API.
Risolvere i problemi comuni
- L'agente di servizio o l'account utente non dispone delle autorizzazioni necessarie.
- Per ulteriore assistenza nella risoluzione dei problemi più comuni, consulta Scenari di errore relativi a backup e ripristino.
Passaggi successivi
- Ripristinare un servizio Dataproc Metastore da un backup
- Aggiornare ed eliminare un servizio Dataproc Metastore