Dataproc Metastore-Endpunktprotokolle

Wenn Sie einen Dataproc Metastore-Dienst erstellen, müssen Sie eines der folgenden Endpunktprotokolle verwenden:

  • Apache Thrift-Protokoll
  • Das gRPC-Protokoll

Dieses Protokoll definiert, wie Ihre Hive Metastore-Clients auf Metadaten zugreifen, die in Ihrem Dataproc Metastore-Dienst gespeichert sind. Diese Auswahl kann sich auch auf die Features auswirken, die Sie in Ihren Dienst einbinden und verwenden können.

Auf dieser Seite werden die konzeptionellen Unterschiede zwischen den einzelnen Endpunktprotokollen erläutert.

Apache-Secondhand

Das Apache Thrift-Protokoll ist die Legacy-Standardoption, die beim Erstellen eines Dataproc Metastore-Dienstes vorausgewählt ist.

Wenn Sie Kerberos in Ihrer Implementierung benötigen, sollten Sie diese Option verwenden. Wenn Sie Kerberos nicht benötigen, können Sie das gRPC-Protokoll verwenden, das Zugriff auf zusätzliche Funktionen bietet.

Wenn Sie einen Thrift-Endpunkt verwenden, können Sie die Portnummer auswählen, zu der die Thrift-Schnittstelle eine Verbindung herstellt. Standardmäßig wird die Portnummer 9083 verwendet.

Nach Auswahl des Thrift-Protokolls

Nachdem Sie einen Dataproc Metastore mit Thrift erstellt haben, können Sie über einen Dataproc-Cluster oder einen selbstverwalteten Cluster eine Verbindung zu ihm herstellen. Ihr Cluster verwendet dann Dataproc Metastore als Hive-Metastore.

gRPC

Das gRPC-Protokoll ist die moderne, portierbare und leistungsstarke Option, die Sie beim Erstellen eines Dataproc Metastore-Dienstes explizit auswählen müssen.

Wenn Sie das gRPC-Protokoll auswählen, können Sie es später nicht mehr auf Thrift aktualisieren. Wenn Sie von gRPC zu Thrift wechseln möchten, müssen Sie einen neuen Dataproc Metastore erstellen.

Wenn Sie einen gRPC-Endpunkt verwenden, können Sie nicht die Portnummer auswählen, die von der gRPC-Schnittstelle verwendet wird. Stattdessen wird Ihrer Schnittstelle automatisch die Portnummer 443 zugewiesen.

Nach der Auswahl des gRPC-Protokolls

Nachdem Sie einen Dataproc Metastore mit dem gRPC-Endpunktprotokoll erstellt haben, müssen Sie zusätzliche IAM-Rollen zuweisen. Danach können Sie über einen Dataproc-Cluster eine Verbindung herstellen. Ihr Cluster verwendet dann Dataproc Metastore als Hive-Metastore.

Nächste Schritte