Anda dapat menginstal komponen tambahan seperti Solr saat membuat cluster Dataproc menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Solr.
Komponen Apache Solr adalah platform penelusuran perusahaan yang bersifat open source. Server Solr dan UI Web tersedia di port 8983
pada node master cluster.
Mempertahankan file Solr: Secara default, Solr menulis dan membaca file log transaksi dan indeks di HDFS.
Untuk mempertahankan file Solr, gunakan jalur Cloud Storage sebagai direktori rumah Solr dengan menetapkan properti cluster dataproc:solr.gcs.path
saat Anda menginstal komponen.
Menginstal komponen
Instal komponen saat Anda membuat cluster Dataproc. Komponen dapat ditambahkan ke cluster yang dibuat dengan Dataproc versi 1.3 dan yang lebih baru.
Lihat Versi Dataproc yang didukung untuk mengetahui versi komponen yang disertakan dalam setiap rilis image Dataproc.
Perintah gcloud
Untuk membuat cluster Dataproc yang menyertakan komponen Solr, gunakan perintah cluster-name gcloud dataproc clusters create dengan flag --optional-components
. Contoh perintah di bawah menggunakan flag properties
opsional untuk menetapkan jalur Cloud Storage sebagai direktori utama Solr.
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \ ... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
properti cluster ke perintah gcloud dataproc clusters create
untuk menetapkan bucket Cloud Storage tempat dokumen Solr akan disimpan
(direktori utama Solr).REST API
Komponen Solr dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.
Konsol
- Aktifkan komponen dan gateway komponen.
- Di konsol Google Cloud, buka halaman Create a cluster Dataproc. Panel Siapkan cluster dipilih.
- Di bagian Komponen:
- Di bagian Komponen opsional, pilih Solr dan komponen opsional lainnya untuk diinstal di cluster Anda.
- Di bagian Component Gateway, pilih Enable component gateway (lihat Melihat dan Mengakses URL Component Gateway).