Komponen Dataproc

Saat Anda membuat cluster, komponen ekosistem Apache Hadoop standar secara otomatis diinstal di cluster tersebut (lihat Daftar Versi Dataproc). Anda dapat menginstal komponen tambahan, yang disebut "komponen opsional", di cluster saat membuat cluster. Menambahkan komponen opsional ke cluster mirip dengan menambahkan komponen melalui penggunaan tindakan inisialisasi, tetapi memiliki keuntungan berikut:

  • Waktu startup cluster yang lebih cepat
  • Menguji kompatibilitas dengan versi Dataproc tertentu
  • Penggunaan parameter cluster, bukan skrip tindakan inisialisasi
  • Komponen opsional terintegrasi dengan komponen Dataproc lainnya. Misalnya, saat Anaconda dan Zeppelin diinstal di sebuah cluster, Zeppelin akan menggunakan penafsir dan library Python Anaconda.

Komponen opsional yang tersedia

Komponen opsional Component_NAME
dalam perintah gcloud dan permintaan API
Versi Image Tahap Rilis
Anakonda ANACONDA 1.3 dan yang lebih baru
(tidak tersedia di 2.0 dan yang lebih baru)
GA
Docker DOCKER 1.5 dan yang lebih baru GA
Berkedip FLINK 1.5 dan yang lebih baru GA
HBase HBASE 1.5 dan yang lebih baru
(tidak tersedia di 2.1 dan yang lebih baru)
Beta
WebHCat Hive HIVE_WEBHCAT 1.3 dan yang lebih baru GA
Hudi Hudi 1.5 dan yang lebih baru GA
Notebook Jupyter JUPYTER 1.3 dan yang lebih baru GA
Presto PRESTO 1.3 dan yang lebih baru
(tidak tersedia di 2.1 dan yang lebih baru)
GA
Ranger RENTANG 1.3 dan yang lebih baru GA
Solr SOLR 1.3 dan yang lebih baru GA
Trino TRINO 2.1 dan yang lebih baru GA
Notebook Zeppelin ZEPPELIN 1.3 dan yang lebih baru GA
Zookeeper ZOOKEEPER 1.0 dan yang lebih baru GA

Menambahkan komponen opsional

Perintah gcloud

Untuk membuat cluster Dataproc dan menginstal satu atau beberapa komponen opsional pada cluster, gunakan perintah gcloud beta dataproc clusters create cluster-name dengan flag --optional-components.

gcloud dataproc clusters create cluster-name \
  --optional-components=COMPONENT-NAME(s) \
  ... other flags

REST API

Komponen opsional dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.

Konsol

Di Konsol Google Cloud, buka halaman Buat cluster Dataproc. Panel Siapkan cluster dipilih. Di bagian Optional Components di bagian Komponen, pilih satu atau beberapa komponen untuk diinstal pada cluster Anda.