Questa pagina spiega come aggiornare un servizio Dataproc Metastore.
Puoi aggiornare il servizio Dataproc Metastore per modificare le impostazioni di configurazione o per attivare o disattivare le funzionalità facoltative.
Prima di iniziare
Ruoli obbligatori
Per ottenere l'autorizzazione necessaria per aggiornare un servizio Dataproc Metastore, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto, in base al principio del privilegio minimo:
-
Concede il controllo completo delle risorse Dataproc Metastore (
roles/metastore.editor
) -
Concedi l'accesso completo a tutte le risorse Dataproc Metastore, inclusa l'amministrazione dei criteri IAM (
roles/metastore.admin
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Questo ruolo predefinito contiene l'autorizzazione
metastore.services.update
necessaria per
aggiornare un servizio Dataproc Metastore.
Potresti anche riuscire a ottenere questa autorizzazione con ruoli personalizzati altri ruoli predefiniti.
Per ulteriori informazioni su ruoli e autorizzazioni specifici di Dataproc Metastore, consulta la panoramica di IAM di Dataproc Metastore.Informazioni sull'aggiornamento di un servizio
Puoi aggiornare i seguenti parametri di Dataproc Metastore.
- Numero porta. Aggiorna il numero di porta TCP dell'interfaccia Apache Thrift.
- Livello di servizio. Passare dal livello di servizio Developer al livello di servizio Enterprise. Questi livelli influenzano la capacità del servizio.
- Sincronizzazione di Data Catalog. Attiva o disattiva la funzionalità di sincronizzazione di Data Catalog.
- Periodo di manutenzione. Modifica la frequenza del periodo di manutenzione, inclusi Giorno della settimana e Ora del giorno.
- Kerberos. Attiva o disattiva l'autenticazione Kerberos. Se precedentemente attivato, puoi aggiornare i file di configurazione Kerberos.
- Configurazioni del metastore Hive. Aggiorna il percorso della directory del warehouse Hive.
- Configurazione della versione ausiliaria (anteprima). Attiva, disattiva o aggiungi altre versioni ausiliarie.
- Etichette. Aggiungi o rimuovi etichette facoltative che descrivono i metadati.
- Fattore di scalabilità. Modifica il fattore di scala. Puoi abilitare o disabilitare la scalabilità automatica e aggiornare il numero minimo o massimo dei fattori di scalabilità.
Aggiornare un servizio
Prima di eseguire un aggiornamento, tieni presente quanto segue:
- Puoi eseguire un solo job di aggiornamento alla volta (per ogni servizio Dataproc Metastore).
- Puoi aggiornare più parametri in un singolo job di aggiornamento.
- Puoi comunque utilizzare Dataproc Metastore durante l'aggiornamento.
Se l'aggiornamento va a buon fine, Dataproc Metastore entra automaticamente in uno stato attivo. Se l'aggiornamento non va a buon fine, viene eseguito il rollback del servizio Dataproc Metastore allo stato precedente di integrità.
Le istruzioni riportate di seguito mostrano come aggiornare un servizio Dataproc Metastore.
Console
Nella console Google Cloud, apri la pagina Dataproc Metastore:
Nella pagina Dataproc Metastore, fai clic sul nome del servizio che vuoi aggiornare.
Viene visualizzata la pagina Dettagli del servizio.
Nella scheda Configurazione, fai clic su Modifica.
Viene visualizzata la pagina Modifica servizio.
Scegli i valori da aggiornare per il servizio.
Fai clic su Invia.
Torna alla pagina Dataproc Metastore e verifica che il servizio sia stato aggiornato correttamente.
Interfaccia a riga di comando gcloud
Per aggiornare un servizio, esegui questo comando
gcloud metastore services update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --port=PORT \ --tier=TIER \ --maintenance-window-day=MAINTENANCE_WINDOW_DAY \ --maintenance-window-hour=MAINTENANCE_WINDOW_HOUR \ --kerberos_principal=KERBEROS_PRINCIPAL \ --keytab=KEYTAB \ --krb5-config=KRB5_CONFIG \ --update-hive-metastore-configs-from-file=[KEY=VALUE, ...] \ --clear-hive-metastore-configs \ --remove-hive-metastore-configs=[KEY, ...] \ --update-labels=[KEY=VALUE, ...] \ --clear-labels \ --remove-labels=[KEY, ...]
Sostituisci quanto segue:
SERVICE
: il nome del tuo servizio Dataproc Metastore.LOCATION
: la regione Google Cloud in cui si trova il servizio Dataproc Metastore.PORT
: facoltativo. La porta TCP dell'interfaccia Thrift che utilizzi con il servizio Dataproc Metastore.TIER
: facoltativo. La capacità del livello del servizio Dataproc Metastore.MAINTENANCE_WINDOW_DAY
: (facoltativo) il giorno della settimana in cui viene avviata la finestra del servizio.MAINTENANCE_WINDOW_HOUR
: facoltativo: l'ora del giorno in cui viene avviata la finestra del servizio.KERBEROS_PRINCIPAL
: facoltativo. Un'entità Kerberos che esiste sia nel file keytab sia nel KDC. Un tipico ha il formato "primary/instance@REALM", ma non esistono formato esatto.KEYTAB
. (Facoltativo) Un file keytab Kerberos che viene utilizzato per autenticare un'entità servizio con una chiave Kerberos Centro di distribuzione.KRB5_CONFIG
: facoltativo, il file krb5.config specifica il KDC e le informazioni di area di autenticazione Kerberos, che includono posizioni dei KDC e valori predefiniti per area di autenticazione e Kerberos diverse applicazioni.[KEY, ...]
: facoltativo: le configurazioni del metastore Hive che vuoi aggiornare. Se in questo campo è presente una variabile, il suo valore viene aggiornato. In caso contrario, viene creata una nuova variabile. Se questo flag è impostato, viene impostato automaticamente anche-clear-hive-metastore-configs
.[KEY, ...]
: facoltativo: le configurazioni del metastore Hive che vuoi rimuovere.[KEY=VALUE, ...]
: (Facoltativo) Le etichette o le configurazioni delle coppie chiave-valore del metastore Hive da aggiornare.[KEY, ...]
: (Facoltativo) Le etichette o le configurazioni delle coppie chiave-valore del metastore Hive da rimuovere.
Verifica che l'aggiornamento sia riuscito.
REST
Segui le istruzioni dell'API per aggiornare un servizio utilizzando Explorer API.
Aggiorna la configurazione del warehouse Hive Metastore
Se la directory del warehouse Hive si trova su Cloud Storage, devi impostare un valore Metastore o eseguire l'override della configurazione. Con questo override, il data warehouse specifico viene impostato come directory del warehouse predefinito per Dataproc Metastore
Prima di impostare l'override, assicurati che il servizio Dataproc Metastore dispone delle autorizzazioni di lettura e scrittura degli oggetti per accedere alla directory del warehouse. Per maggiori informazioni, consulta la directory del warehouse Hive.
Le istruzioni riportate di seguito mostrano come aggiornare una sostituzione della configurazione di Hive Metastore.
Console
Nella console Google Cloud, apri la pagina Dataproc Metastore:
Nella pagina Dataproc Metastore, fai clic sul nome del servizio da aggiornare.
Viene visualizzata la pagina Dettagli del servizio.
Nella scheda Configurazione, fai clic su Modifica.
Viene visualizzata la pagina Modifica servizio.
In Metastore config overrides (Sostituzioni di configurazione metastore), inserisci quanto segue:
- Chiave: inserisci il seguente valore:
hive.metastore.warehouse.dir
. - Valore: la posizione di Cloud Storage della directory del warehouse. Ad
esempio:
gs://my-bucket/path/to/location
.
- Chiave: inserisci il seguente valore:
Fai clic su Invia.
Torna alla pagina Dataproc Metastore e e verificare che il servizio sia stato aggiornato correttamente.
gcloud
Per aggiornare un servizio, esegui il seguente comando
gcloud metastore services update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --update-hive-metastore-configs="hive.metastore.warehouse.dir=CUSTOMER_DIR"
Sostituisci quanto segue:
SERVICE
: il nome del tuo servizio Dataproc Metastore.LOCATION
: la regione Google Cloud in cui si trova il servizio Dataproc Metastore.CUSTOMER_DIR
: la posizione Cloud Storage della directory del tuo magazzino. Ad esempio:gs://my-bucket/path/to/location
Verifica che l'aggiornamento sia riuscito.