À propos des protocoles de points de terminaison Dataproc Metastore

Lorsque vous créez un service Dataproc Metastore, vous devez choisir d'utiliser l'un des protocoles de point de terminaison suivants:

  • Protocole Apache Thrift
  • Le protocole gRPC

Ce protocole définit la manière dont vos clients Hive Metastore accèdent aux métadonnées stockées dans votre service Dataproc Metastore. Ce choix peut également affecter les fonctionnalités que vous pouvez intégrer et utiliser avec votre service.

Cette page décrit les différences conceptuelles entre chacun des protocoles de points de terminaison.

Apache Thrift

Le protocole Apache Thrift est l'ancienne option par défaut qui est présélectionnée lorsque vous créez un service Dataproc Metastore.

Si vous avez besoin de Kerberos dans votre implémentation, utilisez cette option. Si vous n'avez pas besoin de Kerberos, envisagez d'utiliser le protocole gRPC, qui permet d'accéder à des fonctionnalités supplémentaires.

Si vous utilisez un point de terminaison Thrift, vous pouvez choisir le numéro de port auquel l'interface Thrift se connecte. Par défaut, le numéro de port 9083 est utilisé.

Après avoir choisi le protocole Thrift

Après avoir créé un service Dataproc Metastore à l'aide de Thrift, vous pouvez vous y connecter à partir d'un cluster Dataproc ou un cluster autogéré. Votre cluster utilise ensuite Dataproc Metastore comme métastore Hive.

gRPC

Le protocole gRPC est l'option hautes performances, portable et moderne que vous devez sélectionner explicitement lorsque vous créez un service Dataproc Metastore.

Si vous choisissez le protocole gRPC, vous ne pourrez pas le mettre à jour vers Thrift à une date ultérieure. Si vous souhaitez passer de gRPC à Thrift, vous devez créer un nouveau Dataproc Metastore.

Si vous utilisez un point de terminaison gRPC, vous ne pouvez pas choisir le numéro de port utilisé par l'interface gRPC. À la place, le numéro de port 443 est automatiquement attribué à votre interface.

Après avoir choisi le protocole gRPC

Après avoir créé un service Dataproc Metastore à l'aide du protocole de point de terminaison gRPC, vous devez attribuer des rôles IAM supplémentaires. Vous pouvez ensuite vous y connecter à partir d'un cluster Dataproc. Votre cluster utilise ensuite Dataproc Metastore comme métastore Hive.

Étapes suivantes