Cette page explique comment mettre à jour un service Dataproc Metastore.
Vous pouvez mettre à jour votre service Dataproc Metastore pour modifier les paramètres de configuration, ou pour activer ou désactiver des fonctionnalités facultatives.
Avant de commencer
Rôles requis
Pour obtenir l'autorisation nécessaire pour mettre à jour un service Dataproc Metastore, demandez à votre administrateur de vous attribuer les rôles IAM suivants sur votre projet, selon le principe du moindre privilège:
-
Accorder un contrôle complet sur les ressources Dataproc Metastore (
roles/metastore.editor
) -
Accordez un accès complet à toutes les ressources Dataproc Metastore, y compris pour l'administration des stratégies IAM (
roles/metastore.admin
)
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.
Ce rôle prédéfini contient l'autorisation metastore.services.update
, nécessaire pour mettre à jour un service Dataproc Metastore.
Vous pouvez également obtenir cette autorisation avec des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur des rôles et des autorisations spécifiques à Dataproc Metastore, consultez la page Présentation du service IAM de Dataproc Metastore.À propos de la mise à jour d'un service
Vous pouvez mettre à jour les paramètres Dataproc Metastore suivants.
- Numéro de port : Mettez à jour le numéro de port TCP de l'interface Apache Thrift.
- Niveau de service : Basculez entre le niveau de service Developer (Développeur) ou Enterprise (Entreprise). Ces niveaux ont une incidence sur la capacité du service.
- Synchronisation de Data Catalog Activez ou désactivez la fonctionnalité de synchronisation Data Catalog.
- Intervalle de maintenance : Modifiez la fréquence de l'intervalle de maintenance, y compris Jour de la semaine et Heure de la journée.
- Kerberos : Activer ou désactiver l'authentification Kerberos. Si cette option est déjà activée, vous pouvez mettre à jour vos fichiers de configuration Kerberos.
- Configurations de métastore Hive Mettez à jour l'emplacement du répertoire de votre entrepôt Hive.
- Configuration de la version auxiliaire (preview). Activez, désactivez ou ajoutez des versions auxiliaires supplémentaires.
- Libellés. Ajoutez ou supprimez des libellés facultatifs décrivant vos métadonnées.
- Facteur de scaling. Modifiez le facteur de scaling. Vous pouvez activer ou désactiver l'autoscaling et mettre à jour les facteurs de scaling minimal ou maximal.
Mettre à jour un service
Avant d'exécuter une mise à jour, tenez compte des points suivants:
- Vous ne pouvez exécuter qu'un seul job de mise à jour à la fois (pour chaque service Dataproc Metastore).
- Vous pouvez mettre à jour plusieurs paramètres en une seule tâche de mise à jour.
- Vous pouvez continuer à utiliser Dataproc Metastore pendant la mise à jour.
Une fois la mise à jour effectuée, Dataproc Metastore passe automatiquement à l'état actif. Si la mise à jour échoue, le service Dataproc Metastore revient à son état opérationnel précédent.
Les instructions suivantes expliquent comment mettre à jour un service Dataproc Metastore.
Console
Dans la console Google Cloud, ouvrez la page Dataproc Metastore:
Sur la page Dataproc Metastore, cliquez sur le nom du service que vous souhaitez mettre à jour.
La page Détails du service s'ouvre.
Dans l'onglet Configuration, cliquez sur Modifier.
La page Modifier le service s'ouvre.
Choisissez les valeurs que vous souhaitez mettre à jour pour votre service.
Cliquez sur Envoyer.
Revenez à la page Dataproc Metastore et vérifiez que votre service a bien été mis à jour.
gcloud CLI
Pour mettre à jour un service, exécutez la commande
gcloud metastore services update
suivante:gcloud metastore services update SERVICE \ --location=LOCATION \ --port=PORT \ --tier=TIER \ --maintenance-window-day=MAINTENANCE_WINDOW_DAY \ --maintenance-window-hour=MAINTENANCE_WINDOW_HOUR \ --kerberos_principal=KERBEROS_PRINCIPAL \ --keytab=KEYTAB \ --krb5-config=KRB5_CONFIG \ --update-hive-metastore-configs-from-file=[KEY=VALUE, ...] \ --clear-hive-metastore-configs \ --remove-hive-metastore-configs=[KEY, ...] \ --update-labels=[KEY=VALUE, ...] \ --clear-labels \ --remove-labels=[KEY, ...]
Remplacez les éléments suivants :
SERVICE
: nom de votre service Dataproc Metastore.LOCATION
: région Google Cloud dans laquelle se trouve votre service Dataproc Metastore.PORT
: (facultatif) port TCP de l'interface Thrift que vous utilisez avec votre service Dataproc Metastore.TIER
: (facultatif) niveau de capacité de votre service Dataproc Metastore.MAINTENANCE_WINDOW_DAY
: (facultatif) jour de la semaine où la fenêtre du service commence.MAINTENANCE_WINDOW_HOUR
(facultatif) : heure de la journée à laquelle la fenêtre du service commence.KERBEROS_PRINCIPAL
: (facultatif) un compte principal Kerberos qui existe à la fois dans le keytab et dans le KDC. Un compte principal typique se présente sous la forme "primary/instance@REALM", mais il n'existe pas de format exact.KEYTAB
(facultatif) : fichier keytab Kerberos utilisé pour authentifier un principal de service auprès d'un centre de distribution de clés Kerberos.KRB5_CONFIG
: (facultatif) le fichier krb5.config spécifie les informations du KDC et du domaine Kerberos, qui incluent les emplacements des KDC et les valeurs par défaut du domaine et des applications Kerberos.[KEY, ...]
: (facultatif) les configurations de métastore Hive que vous souhaitez mettre à jour. Si une variable existe dans ce champ, sa valeur est mise à jour. Sinon, une variable est créée. Si cet indicateur est défini,-clear-hive-metastore-configs
est également défini automatiquement.[KEY, ...]
: (facultatif) les configurations de métastore Hive que vous souhaitez supprimer.[KEY=VALUE, ...]
(facultatif) : libellés ou configurations de paires clé/valeur du métastore Hive que vous souhaitez mettre à jour.[KEY, ...]
: (facultatif) les libellés ou les configurations de paire clé-valeur de métastore Hive que vous souhaitez supprimer.
Vérifiez que la mise à jour a bien été effectuée.
REST
Suivez les instructions de l'API pour mettre à jour un service à l'aide de l'explorateur d'API.
Mettre à jour la configuration de l'entrepôt de métastore Hive
Si votre répertoire d'entrepôt Hive se trouve sur Cloud Storage, vous devez définir un remplacement de configuration du métastore. Ce remplacement définit votre entrepôt de données spécifique comme répertoire d'entrepôt par défaut pour Dataproc Metastore.
Avant de définir ce forçage, assurez-vous que votre service Dataproc Metastore dispose d'autorisations de lecture et d'écriture des objets pour accéder au répertoire de l'entrepôt. Pour en savoir plus, consultez la section Répertoire d'entrepôt Hive.
Les instructions suivantes vous expliquent comment mettre à jour un remplacement de configuration du métastore Hive.
Console
Dans la console Google Cloud, ouvrez la page "Dataproc Metastore" :
Sur la page Dataproc Metastore, cliquez sur le nom du service à mettre à jour.
La page Détails du service s'ouvre.
Dans l'onglet Configuration, cliquez sur Modifier.
La page Modifier le service s'ouvre.
Dans Remplacements de configuration du métastore, saisissez la commande suivante:
- Clé : saisissez la valeur
hive.metastore.warehouse.dir
. - Valeur: emplacement Cloud Storage du répertoire de votre entrepôt. Par exemple,
gs://my-bucket/path/to/location
.
- Clé : saisissez la valeur
Cliquez sur Envoyer.
Revenez à la page Dataproc Metastore et vérifiez que votre service a bien été mis à jour.
gcloud
Pour mettre à jour un service, exécutez la commande
gcloud metastore services update
suivante:gcloud metastore services update SERVICE \ --location=LOCATION \ --update-hive-metastore-configs="hive.metastore.warehouse.dir=CUSTOMER_DIR"
Remplacez les éléments suivants :
SERVICE
: nom de votre service Dataproc Metastore.LOCATION
: région Google Cloud dans laquelle se trouve votre service Dataproc Metastore.CUSTOMER_DIR
: emplacement Cloud Storage du répertoire de votre entrepôt. Par exemple :gs://my-bucket/path/to/location
Vérifiez que la mise à jour a bien été effectuée.