Dataproc Metastore エンドポイント プロトコルについて

Dataproc Metastore サービスを作成する際は、次のいずれかのエンドポイント プロトコルの使用を選択する必要があります。

  • Apache Thrift プロトコル
  • gRPC プロトコル

このプロトコルでは、Hive メタストア クライアントが Dataproc Metastore サービスに保存されているメタデータにアクセスする方法を定義します。この選択は、サービスと統合して使用できる機能にも影響する可能性があります。

このページでは、各エンドポイント プロトコルの概念的な違いについて説明します。

Apache Thrift

Apache Thrift プロトコルは、Dataproc Metastore サービスの作成時に事前に選択されたレガシーのデフォルト オプションです。

実装に Kerberos が必要な場合は、このオプションを使用してください。Kerberos を必要としない場合は、gRPC プロトコルを使用することを検討してください。これにより、追加の機能にアクセスできるようになります。

Thrift エンドポイントを使用する場合は、Thrift インターフェースが接続するポート番号を選択できます。デフォルトでは、ポート番号 9083 が使用されます。

Thrift プロトコルの選択後

Thrift を使用して Dataproc Metastore を作成すると、Dataproc クラスタまたはセルフマネージド クラスタから接続できます。クラスタは Hive メタストアとして Dataproc Metastore を使用します。

gRPC

gRPC プロトコルは、最新でポータブルな高パフォーマンス オプションであり、Dataproc Metastore サービスの作成時に明示的に選択する必要があります。

gRPC プロトコルを選択した場合、後で Thrift にアップデートすることはできません。gRPC から Thrift に移行する場合は、新しい Dataproc Metastore を作成する必要があります。

gRPC エンドポイントを使用する場合、gRPC インターフェースが使用するポート番号は選択できません。代わりに、ポート番号 443 が自動的にインターフェースに割り当てられます。

gRPC プロトコルの選択後

gRPC エンドポイント プロトコルを使用して Dataproc Metastore を作成したら、追加の IAM ロールを付与する必要があります。これで、Dataproc クラスタから接続できるようになります。クラスタは Hive メタストアとして Dataproc Metastore を使用します。

次のステップ