Halaman ini diterjemahkan oleh Cloud Translation API.

Layanan Dataproc

Halaman ini mencantumkan layanan yang dijalankan oleh versi image Dataproc di node cluster Dataproc.

Semua node

Layanan berikut berjalan di semua node dalam cluster.

Jenis node	Layanan	Versi image	Deskripsi
Semua node	google-dataproc-agent	semua	Menerima tugas dari Dataproc dan meluncurkan driver tugas
Semua node	google-fluentd	semua	Mengumpulkan dan mengirim log ke Logging

Cluster standar

Layanan berikut berjalan di cluster standar.

Jenis node	Layanan	Versi image	Deskripsi
Semua node	hadoop-hdfs-namenode	semua	Mengelola sistem file HDFS
	hadoop-hdfs-secondarynamenode	semua	Memeriksa NameNode
	hadoop-mapreduce-historyserver	semua	Menayangkan informasi histori aplikasi mapreduce
	hadoop-yarn-resourcemanager	semua	Menjadwalkan dan mengelola aplikasi YARN
	hadoop-yarn-timelineserver	1.3+	Menayangkan informasi histori aplikasi YARN
	hive-metastore	semua	Mengelola metadata tabel Hive. Secara default, menggunakan database lokal `mariadb` (versi image < 1.5) atau `mysql` (versi image 1.5+) di node master sebagai penyimpanan metadata tabel Hive. Penggunaan database default tidak direkomendasikan karena database ini terikat dengan siklus proses cluster. Sebagai gantinya, gunakan salah satu dari opsi berikut sebagai database metastore Hive (dalam urutan rekomendasi): Dataproc Metastore Instance Cloud SQL
	hive-server2	semua	Menayangkan kueri yang diterima dari klien (terutama kueri shell beeline) terhadap Hive
	mariadb	< 1,5	Database relasional yang digunakan sebagai database dasar default untuk metastore Hive di image Dataproc < 1.5
	mysql	1,5+	Database relasional yang digunakan sebagai database dasar default untuk metastore Hive dalam image Dataproc 1.5+
	nfs-kernel-server	< 1,3	NFS adalah Network File System.
	spark-history-server	semua	Menayangkan informasi histori aplikasi Spark
Semua Pekerja	hadoop-yarn-nodemanager	semua	Meluncurkan dan mengelola penampung YARN
Khusus Pekerja Utama	hadoop-hdfs-datanode	semua	Menyimpan blok HDFS

Cluster HA

Di cluster Ketersediaan Tinggi (HA) Dataproc, berbagai layanan berjalan di node master yang berbeda, seperti yang ditunjukkan di bawah. Layanan node pekerja cluster HA sama dengan yang tercantum untuk cluster standar.

Jenis node	Layanan	Versi image	Deskripsi
Semua master	hadoop-hdfs-journalnode	semua	Kuorum node jurnal mempertahankan log edit dari perubahan namespace HDFS. Jika terjadi failover, NameNode Standby akan membaca log edit dan mengambil kontrol dari NameNode Aktif.
	hadoop-yarn-resourcemanager	semua	Menjadwalkan dan mengelola aplikasi YARN
	hive-metastore	semua	Mengelola metadata tabel Hive. Secara default, menggunakan database lokal `mariadb` (versi image < 1.5) atau `mysql` (versi image 1.5+) di node master sebagai penyimpanan metadata tabel Hive. Penggunaan database default tidak direkomendasikan karena database ini terikat dengan siklus proses cluster. Sebagai gantinya, gunakan salah satu dari opsi berikut sebagai database metastore Hive (dalam urutan rekomendasi): Dataproc Metastore Instance Cloud SQL
	hive-server2	semua	Menayangkan kueri yang diterima dari klien (terutama kueri shell beeline) terhadap Hive
	zookeeper-server	semua	Kuorum ZooKeeper digunakan untuk koordinasi terdistribusi. Di cluster Ketersediaan Tinggi (HA), zkfc digunakan untuk pemilihan leader HDFS NameNode dan pengelola resource YARN.
Khusus Master 0 dan 1	hadoop-hdfs-namenode	semua	Mengelola sistem file HDFS
Khusus Master 0 dan 1	hadoop-hdfs-zkfc	semua	ZKFC adalah proses `ZKFailoverController`, yang berjalan dengan NameNode HDFS. ZooKeeper memantau kondisi NameNode, dan mengelola pemilihan leader melalui ZooKeeper jika terjadi failover.
Khusus Master 0	hadoop-mapreduce-historyserver	semua	Menayangkan informasi histori aplikasi mapreduce
	hadoop-yarn-timelineserver	1.3+	Menayangkan informasi histori aplikasi YARN
	mariadb	< 1,5	Database relasional yang digunakan sebagai database dasar default untuk metastore Hive di image Dataproc < 1.5
	mysql	1,5+	Database relasional yang digunakan sebagai database dasar default untuk metastore Hive dalam image Dataproc 1.5+
	nfs-kernel-server	< 1,3	NFS adalah Network File System.
	spark-history-server	semua	Menayangkan informasi histori aplikasi Spark