Dataproc Metastore 端点协议简介

创建 Dataproc Metastore 服务时,您必须选择使用以下端点协议之一:

  • Apache Thrift 协议
  • gRPC 协议

此协议定义了您的 Hive Metastore 客户端如何访问存储在 Dataproc Metastore 服务中的元数据。此选择还会影响可与服务集成和使用的功能。

本页面介绍了每个端点协议之间的概念差异。

Apache Thrift

Apache Thrift 协议是创建 Dataproc Metastore 服务时预先选择的旧版默认选项。

如果您在实现过程中需要 Kerberos,则应使用此选项。如果您不需要 Kerberos,不妨考虑使用 gRPC 协议,它可以提供对其他功能的访问权限。

如果您使用 Thrift 端点,则可以选择 Thrift 接口连接到的端口号。默认情况下,使用端口号 9083

选择 Thrift 协议后

使用 Thrift 创建 Dataproc Metastore 后,您可以从 Dataproc 集群或自行管理的集群连接到 Dataproc Metastore。然后,您的集群会使用 Dataproc Metastore 作为其 Hive Metastore。

gRPC

gRPC 协议是一种现代化、可移植的高性能方案,您必须在创建 Dataproc Metastore 服务时明确选择该选项。

如果您选择 gRPC 协议,日后将无法将其更新为 Thrift。如果您想从 gRPC 迁移到 Thrift,必须创建一个新的 Dataproc Metastore。

如果您使用 gRPC 端点,则无法选择 gRPC 接口使用的端口号。相反,端口号 443 会自动分配给您的接口。

选择 gRPC 协议后

使用 gRPC 端点协议创建 Dataproc Metastore 后,您必须授予其他 IAM 角色。之后,您可以从 Dataproc 集群连接到该集群。然后,您的集群会使用 Dataproc Metastore 作为其 Hive Metastore。

后续步骤