Wenn Sie einen Dataproc Metastore-Dienst erstellen, müssen Sie eines der folgenden Endpunktprotokolle verwenden:
- Das Apache Thrift-Protokoll
- Das gRPC-Protokoll
Dieses Protokoll definiert, wie Ihre Hive-Metastore-Clients auf Metadaten zugreifen, die in Ihrem Dataproc Metastore-Dienst gespeichert sind. Diese Wahl kann sich auch auf die Funktionen auswirken, die Sie in Ihren Dienst einbinden und verwenden können.
Auf dieser Seite werden die konzeptionellen Unterschiede zwischen den einzelnen Endpunktprotokollen erläutert.
Apache Thrift
Das Apache Thrift-Protokoll ist die alte Standardoption, die beim Erstellen eines Dataproc Metastore-Dienstes vorausgewählt ist.
Wenn Sie Kerberos in Ihrer Implementierung benötigen, sollten Sie diese Option verwenden. Wenn Sie Kerberos nicht benötigen, sollten Sie das gRPC-Protokoll verwenden, das Zugriff auf zusätzliche Funktionen bietet.
Wenn Sie einen Thrift-Endpunkt verwenden, können Sie die Portnummer auswählen, über die die Thrift-Schnittstelle verbunden wird. Standardmäßig wird die Portnummer 9083
verwendet.
Nach Auswahl des Thrift-Protokolls
Nachdem Sie einen Dataproc-Metastore mit Thrift erstellt haben, können Sie eine Verbindung von einem Dataproc-Cluster oder einem selbstverwalteten Cluster herstellen. Ihr Cluster verwendet dann Dataproc Metastore als Hive-Metastore.
gRPC
Das gRPC-Protokoll ist die moderne, portable und leistungsstarke Option, die Sie beim Erstellen eines Dataproc Metastore-Dienstes explizit auswählen müssen.
Wenn Sie das gRPC-Protokoll auswählen, können Sie es später nicht auf Thrift umstellen. Wenn Sie von gRPC zu Thrift wechseln möchten, müssen Sie einen neuen Dataproc Metastore erstellen.
Wenn Sie einen gRPC-Endpunkt verwenden, können Sie die Portnummer, die von der gRPC-Schnittstelle verwendet wird, nicht auswählen. Stattdessen wird der Port 443
automatisch Ihrer Schnittstelle zugewiesen.
Nach der Auswahl des gRPC-Protokolls
Nachdem Sie einen Dataproc Metastore mit dem gRPC-Endpunktprotokoll erstellt haben, müssen Sie zusätzliche IAM-Rollen gewähren. Anschließend können Sie über einen Dataproc-Cluster eine Verbindung herstellen. Ihr Cluster verwendet dann Dataproc Metastore als Hive-Metastore.