Saat membuat layanan Dataproc Metastore, Anda harus memilih untuk menggunakan salah satu protokol endpoint berikut:
- Protokol Apache Thrift
- Protokol gRPC
Protokol ini menentukan cara klien Hive Metastore mengakses metadata yang disimpan di layanan Dataproc Metastore Anda. Pilihan ini juga dapat memengaruhi fitur yang dapat Anda integrasikan dan gunakan dengan layanan.
Halaman ini menjelaskan perbedaan konseptual antara setiap protokol endpoint.
Apache Hemat
Protokol Apache Thrift adalah opsi default lama yang dipilih sebelumnya saat Anda membuat layanan Dataproc Metastore.
Jika Anda memerlukan Kerberos dalam penerapan, Anda harus menggunakan opsi ini. Jika Anda tidak memerlukan Kerberos, pertimbangkan untuk menggunakan protokol gRPC, yang menyediakan akses ke fitur tambahan.
Jika menggunakan endpoint Thrift, Anda dapat memilih nomor port yang terhubung ke antarmuka
Thrift. Secara default, nomor port 9083
akan digunakan.
Setelah memilih protokol Thrift
Setelah membuat Dataproc Metastore menggunakan Thrift, Anda dapat menghubungkannya dari cluster Dataproc atau cluster yang dikelola sendiri. Cluster Anda kemudian menggunakan Dataproc Metastore sebagai metastore Hive-nya.
gRPC
Protokol gRPC adalah opsi modern, portabel, berperforma tinggi yang harus Anda pilih secara eksplisit saat membuat layanan Metastore Dataproc.
Jika memilih protokol gRPC, Anda tidak dapat memperbaruinya ke Thrift di lain waktu. Jika ingin beralih dari gRPC ke Thrift, Anda harus membuat Dataproc Metastore baru.
Jika menggunakan endpoint gRPC, Anda tidak dapat memilih nomor port yang digunakan
antarmuka gRPC. Sebagai gantinya, nomor port 443
akan otomatis ditetapkan ke antarmuka
Anda.
Setelah memilih protokol gRPC
Setelah membuat Dataproc Metastore menggunakan protokol endpoint gRPC, Anda harus memberikan peran IAM tambahan. Setelah itu, Anda dapat terhubung ke cluster tersebut dari cluster Dataproc. Cluster Anda kemudian menggunakan Dataproc Metastore sebagai metastore Hive-nya.