Informazioni sui protocolli endpoint di Dataproc Metastore

Quando crei un servizio Dataproc Metastore, devi scegliere di utilizzare uno dei seguenti protocolli di endpoint:

  • Protocollo Apache Thrift
  • Il protocollo gRPC

Questo protocollo definisce il modo in cui i client Hive Metastore accedono ai metadati archiviati nel servizio Dataproc Metastore. Questa scelta può influire anche sulle funzionalità che puoi integrare e utilizzare con il tuo servizio.

Questa pagina illustra le differenze concettuali tra ciascuno dei protocolli degli endpoint.

Apache Thrift

Il protocollo Apache Thrift è l'opzione predefinita legacy che viene preselezionata quando crei un servizio Dataproc Metastore.

Se richiedi Kerberos nella tua implementazione, ti consigliamo di utilizzare questa opzione. Se non richiedi Kerberos, valuta l'utilizzo del protocollo gRPC, che fornisce l'accesso a funzionalità aggiuntive.

Se utilizzi un endpoint Thrift, puoi scegliere il numero di porta a cui si connette l'interfaccia di Thrift. Per impostazione predefinita, viene utilizzato il numero di porta 9083.

Dopo aver scelto il protocollo Thrift

Dopo aver creato Dataproc Metastore utilizzando Thrift, puoi connetterti da un cluster Dataproc o da un cluster autogestito. Il cluster utilizza quindi Dataproc Metastore come metastore Hive.

gRPC

Il protocollo gRPC è l'opzione moderna, portabile e ad alte prestazioni che devi selezionare esplicitamente quando crei un servizio Dataproc Metastore.

Se scegli il protocollo gRPC, non puoi aggiornarlo a Thrift in un secondo momento. Se vuoi passare da gRPC a Thrift, devi creare un nuovo Dataproc Metastore.

Se utilizzi un endpoint gRPC, non puoi scegliere il numero di porta utilizzato dall'interfaccia gRPC. Il numero di porta 443 viene invece assegnato automaticamente alla tua interfaccia.

Dopo aver scelto il protocollo gRPC

Dopo aver creato Dataproc Metastore utilizzando il protocollo dell'endpoint gRPC, devi concedere ruoli IAM aggiuntivi. Successivamente, puoi connetterti da un cluster Dataproc. Il cluster utilizza quindi Dataproc Metastore come metastore Hive.

Passaggi successivi