Dataproc Metastore 엔드포인트 프로토콜 정보

Dataproc Metastore 서비스를 만들 때는 다음 엔드포인트 프로토콜 중 하나를 사용해야 합니다.

  • Apache Thrift 프로토콜
  • gRPC 프로토콜

이 프로토콜은 Hive Metastore 클라이언트가 Dataproc Metastore 서비스에 저장된 메타데이터에 액세스하는 방법을 정의합니다. 이 옵션은 서비스에 통합 및 사용할 수 있는 기능에도 영향을 줍니다.

이 페이지에서는 각 엔드포인트 프로토콜 사이의 개념적 차이점을 설명합니다.

Apache Thrift

Apache Thrift 프로토콜은 Dataproc Metastore 서비스를 만들 때 사전 선택되는 레거시 기본 옵션입니다.

구현에 Kerberos가 필요하면 이 옵션을 사용해야 합니다. Kerberos가 필요하지 않으면 추가 기능에 대한 액세스를 제공하는 gRPC 프로토콜을 사용하는 것이 좋습니다.

Thrift 엔드포인트를 사용하는 경우 Thrift 인터페이스가 연결되는 포트 수를 선택할 수 있습니다. 기본적으로 포트 번호 9083이 사용됩니다.

Thrift 프로토콜 선택 후

Thrift를 사용하여 Dataproc Metastore를 만든 후에는 Dataproc 클러스터 또는 자체 관리형 클러스터에서 연결할 수 있습니다. 그런 후 클러스터에서 Dataproc Metastore가 Hive 메타스토어로 사용됩니다.

gRPC

gRPC 프로토콜은 Dataproc Metastore 서비스를 만들 때 명시적으로 선택해야 하는 최신의 포팅 가능한 고성능 옵션입니다.

gRPC 프로토콜을 선택하면 나중에 이를 Thrift로 업데이트할 수 없습니다. gRPC에서 Thrift로 이동하려면 Dataproc Metastore를 새로 만들어야 합니다.

gRPC 엔드포인트를 사용하는 경우 gRPC 인터페이스에 사용되는 포트 번호를 선택할 수 없습니다. 대신 포트 번호 443이 인터페이스에 자동으로 지정됩니다.

gRPC 프로토콜 선택 후

gRPC 엔드포인트 프로토콜을 사용하여 Dataproc Metastore를 만든 후에는 추가 IAM 역할을 부여해야 합니다. 그런 다음 Dataproc 클러스터에서 연결할 수 있습니다. 그런 후 클러스터에서 Dataproc Metastore가 Hive 메타스토어로 사용됩니다.

다음 단계