Acerca de los protocolos de extremos de Dataproc Metastore

Cuando creas un servicio de Dataproc Metastore, debes elegir usar uno de los siguientes protocolos de extremos:

  • El protocolo Apache Thrift
  • El protocolo gRPC

Este protocolo define cómo los clientes de Hive Metastore acceden a los metadatos almacenados en tu servicio de Dataproc Metastore. Esta opción también puede afectar las funciones que puedes integrar y usar con tu servicio.

En esta página, se explican las diferencias conceptuales entre cada uno de los protocolos de extremos.

Apache Thrift

El protocolo Apache Thrift es la opción predeterminada heredada que se preselecciona cuando creas un servicio de Dataproc Metastore.

Si necesitas Kerberos en la implementación, usa esta opción. Si no necesitas Kerberos, considera usar el protocolo gRPC, que proporciona acceso a funciones adicionales.

Si usas un extremo de Thrift, puedes elegir el número de puerto al que se conecta la interfaz de Thrift. De forma predeterminada, se usa el número de puerto 9083.

Después de elegir el protocolo Thrift

Después de crear un Dataproc Metastore con Thrift, puedes conectarte a él desde un clúster de Dataproc o un clúster autoadministrado. Luego, el clúster usa Dataproc Metastore como su almacén de metadatos de Hive.

gRPC

El protocolo gRPC es la opción moderna, portátil y de alto rendimiento que debes seleccionar de forma explícita cuando creas un servicio de Dataproc Metastore.

Si eliges el protocolo gRPC, no podrás actualizarlo a Thrift en una fecha posterior. Si deseas migrar de gRPC a Thrift, debes crear un Dataproc Metastore nuevo.

Si usas un extremo de gRPC, no puedes elegir el número de puerto que usa la interfaz de gRPC. En su lugar, el número de puerto 443 se asigna automáticamente a tu interfaz.

Después de elegir el protocolo gRPC

Después de crear un Dataproc Metastore con el protocolo de extremo de gRPC, debes otorgar funciones de IAM adicionales. Después, puedes conectarte a él desde un clúster de Dataproc. Luego, el clúster usa Dataproc Metastore como su almacén de metadatos de Hive.

¿Qué sigue?