Cluster node tunggal adalah cluster Dataproc yang hanya memiliki satu node. Node tunggal ini berfungsi sebagai master dan pekerja untuk cluster Dataproc Anda. Meskipun cluster node tunggal hanya memiliki satu node, sebagian besar konsep dan fitur Dataproc masih berlaku, kecuali yang tercantum di bawah.
Ada sejumlah situasi saat cluster Dataproc node tunggal dapat berguna, termasuk:
- Mencoba versi baru Spark dan Hadoop atau komponen open source lainnya
- Membuat demonstrasi bukti konsep (PoC)
- Data science ringan
- Pemrosesan data non-penting skala kecil
- Pendidikan terkait ekosistem Spark dan Hadoop
Semantik cluster node tunggal
Semantik berikut berlaku untuk cluster Dataproc node tunggal:
- Cluster node tunggal dikonfigurasi sama seperti cluster Dataproc multi-node, dan menyertakan layanan seperti HDFS dan YARN.
- Cluster node tunggal melaporkan sebagai node master untuk tindakan inisialisasi.
- Cluster node tunggal menampilkan 0 pekerja karena node tunggal bertindak sebagai master sekaligus pekerja.
- Cluster node tunggal diberi nama host yang mengikuti pola
clustername-m
. Anda dapat menggunakan nama host ini untuk melakukan SSH ke atau terhubung ke UI web di node. - Cluster node tunggal tidak dapat diupgrade ke cluster multi node. Setelah dibuat, cluster node tunggal dibatasi untuk satu node. Demikian pula, cluster multi-node tidak dapat diskalakan ke cluster node tunggal.
Batasan
Cluster node tunggal tidak direkomendasikan untuk pemrosesan data paralel berskala besar. Jika Anda melebihi resource di cluster node tunggal, sebaiknya gunakan cluster Dataproc multi-node.
Cluster node tunggal tidak tersedia dengan ketersediaan tinggi karena hanya ada satu node dalam cluster.
Cluster node tunggal tidak dapat menggunakan preemptible VM.
Membuat cluster node tunggal
perintah gcloud
Anda dapat membuat cluster Dataproc satu node menggunakan alat command line gcloud
. Untuk membuat cluster node tunggal, teruskan flag --single-node
ke perintah gcloud dataproc clusters create.
gcloud dataproc clusters create cluster-name \ --region=region \ --single-node \ ... other args
REST API
Anda dapat membuat cluster node tunggal melalui Dataproc REST API menggunakan permintaan clusters.create. Saat membuat permintaan ini, Anda harus:
- Tambahkan properti
"dataproc:dataproc.allow.zero.workers":"true"
ke SoftwareConfig permintaan cluster. - Jangan kirimkan nilai untuk
workerConfig
dansecondaryWorkerConfig
(lihat ClusterConfig).
Konsol
Anda dapat membuat cluster node tunggal dengan memilih "Node Tunggal (1 master, 0 pekerja)" di bagian Jenis cluster pada panel Siapkan cluster di halaman Buat cluster Dataproc.