Saat membuat layanan Dataproc Metastore, Anda harus memilih untuk menggunakan salah satu protokol endpoint berikut:
- Protokol Apache Thrift
- Protokol gRPC
Protokol ini menentukan cara klien Hive Metastore Anda mengakses metadata yang disimpan di layanan Dataproc Metastore. Pilihan ini juga dapat memengaruhi fitur yang dapat Anda integrasikan dan gunakan dengan layanan Anda.
Halaman ini menjelaskan perbedaan konseptual antara setiap protokol endpoint.
Apache Thrift
Protokol Apache Thrift adalah opsi default lama yang dipilih sebelumnya saat Anda membuat layanan Dataproc Metastore.
Jika memerlukan Kerberos dalam penerapan, Anda harus menggunakan opsi ini. Jika Anda tidak memerlukan Kerberos, pertimbangkan untuk menggunakan protokol gRPC, yang menyediakan akses ke fitur tambahan.
Jika menggunakan endpoint Thrift, Anda dapat memilih nomor port yang terhubung ke antarmuka
Thrift. Secara default, nomor port 9083
digunakan.
Setelah memilih protokol Thrift
Setelah membuat Dataproc Metastore menggunakan Thrift, Anda dapat terhubung ke metastore tersebut dari cluster Dataproc atau cluster terkelola mandiri. Cluster Anda kemudian akan menggunakan Dataproc Metastore sebagai metastore Hive-nya.
gRPC
Protokol gRPC adalah opsi performa tinggi, portabel, dan modern yang harus Anda pilih secara eksplisit saat membuat layanan Dataproc Metastore.
Jika memilih protokol gRPC, Anda tidak dapat mengupdatenya ke Thrift di lain waktu. Jika ingin beralih dari gRPC ke Thrift, Anda harus membuat Dataproc Metastore baru.
Jika menggunakan endpoint gRPC, Anda tidak dapat memilih nomor port yang digunakan antarmuka gRPC. Sebagai gantinya, nomor port 443
akan otomatis ditetapkan ke antarmuka Anda.
Setelah memilih protokol gRPC
Setelah membuat Dataproc Metastore menggunakan protokol endpoint gRPC, Anda harus memberikan peran IAM tambahan. Setelah itu, Anda dapat terhubung ke cluster tersebut dari cluster Dataproc. Cluster Anda kemudian akan menggunakan Dataproc Metastore sebagai metastore Hive-nya.