Componente Solr facoltativo di Dataproc

Puoi installare componenti aggiuntivi come Solr quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Solr.

Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e Le UI web sono disponibili sulla porta 8983 nei nodi master del cluster.

File Solr persistenti: per impostazione predefinita, Solr scrive e legge l'indice e i file di log delle transazioni HDFS. Per mantenere i file Solr, utilizza un percorso Cloud Storage come home directory di Solr impostando la dataproc:solr.gcs.path proprietà cluster quando installi il componente.

Installa il componente

Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successivi.

Consulta Versioni Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.

Comando g-cloud

Per creare un cluster Dataproc che includa il componente Solr, utilizza la gcloud dataproc clusters create cluster-name con il flag --optional-components. Il comando di esempio riportato di seguito utilizza l'attributo facoltativo properties per impostare un percorso Cloud Storage come home directory Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Aggiungi --properties="dataproc:solr.gcs.path=gs://bucket-name/" del cluster alla gcloud dataproc clusters create per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr (Home directory di Solr).

API REST

Il componente Solr può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

  1. Attiva il componente e il gateway dei componenti.