Ao criar um serviço Dataproc Metastore, você precisa optar por usar um dos seguintes protocolos de endpoint:
- Protocolo Apache Thrift
- Protocolo gRPC
Esse protocolo define como os clientes do Hive Metastore acessam os metadados armazenados no seu serviço Metastore do Dataproc. Essa escolha também pode afetar os recursos que você pode integrar e usar com seu serviço.
Nesta página, explicamos as diferenças conceituais entre cada um dos protocolos de endpoint.
Apache thrift
O protocolo Apache Thrift é a opção padrão legada que é pré-selecionada quando você cria um serviço Metastore do Dataproc.
Se você precisa do Kerberos na sua implementação, use esta opção. Se você não precisa do Kerberos, use o protocolo gRPC, que fornece acesso a recursos adicionais.
Se você usa um endpoint do Thrift, pode escolher o número da porta a que a interface
do Thrift se conecta. Por padrão, o número da porta 9083
é usado.
Depois de escolher o protocolo do Thrift
Depois de criar um metastore do Dataproc usando o Thrift, conecte-se a ele a partir de um cluster do Dataproc ou do cluster autogerenciado. Em seguida, o cluster usa o metastore do Dataproc como metastore Hive.
gRPC
O protocolo gRPC é a opção moderna, portátil e de alto desempenho que precisa ser selecionada explicitamente ao criar um serviço Metastore do Dataproc.
Se você escolher o protocolo gRPC, não poderá atualizá-lo para o Thrift em uma data posterior. Se você quiser migrar do gRPC para o Thrift, crie um novo metastore do Dataproc.
Se você usar um endpoint gRPC, não poderá escolher o número da porta que a interface gRPC usa. Em vez disso, o número da porta 443
é atribuído automaticamente à sua
interface.
Depois de escolher o protocolo gRPC
Depois de criar um Dataproc Metastore usando o protocolo de endpoint gRPC, você precisa conceder outros papéis do IAM. Depois, será possível se conectar a ele a partir de um cluster do Dataproc. Em seguida, o cluster usa o metastore do Dataproc como metastore Hive.