Componente facoltativo Solr di Dataproc

Puoi installare componenti aggiuntivi come Solr quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. In questa pagina viene descritto il componente Solr.

Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e la UI web sono disponibili sulla porta 8983 sui nodi master del cluster.

File Solr persistenti: per impostazione predefinita, Solr scrive e legge i file di log dell'indice e delle transazioni in HDFS. Per rendere persistenti i file Solr, utilizza un percorso Cloud Storage come home directory di Solr impostando la proprietà cluster dataproc:solr.gcs.path quando installi il componente.

Installa il componente

Installa il componente quando crei un cluster Dataproc. Puoi aggiungere componenti ai cluster creati con Dataproc versione 1.3 e successive.

Consulta le versioni di Dataproc supportate per la versione dei componenti inclusa in ogni release di immagine Dataproc.

Comando g-cloud

Per creare un cluster Dataproc che includa il componente Solr, utilizza il comando cluster-name gcloud dataproc clusters create con il flag --optional-components. Il comando di esempio riportato di seguito utilizza il flag facoltativo properties per impostare un percorso Cloud Storage come home directory di Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Aggiungi la --properties="dataproc:solr.gcs.path=gs://bucket-name/" proprietà cluster al comando gcloud dataproc clusters create per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr (home directory di Solr).

API REST

Il componente Solr può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

  1. Abilita il gateway del componente e del componente.
    • Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
    • Nella sezione Componenti: