Componente Solr Dataproc facoltativo

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Puoi installare componenti aggiuntivi come Solr quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. In questa pagina viene descritto il componente Solr.

Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e l'UI web sono disponibili sulla porta 8983 nei nodi master del cluster.

File permanenti come permanente:per impostazione predefinita, Solr scrive e legge i file di log dell'indice e delle transazioni in HDFS. Per salvare i file di Solr, utilizza un percorso Cloud Storage come directory home di Solr impostando la dataproc:solr.gcs.path proprietà cluster quando installi il componente.

Installa il componente

Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successive.

Consulta la pagina relativa alle versioni di Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.

Comando gcloud

Per creare un cluster Dataproc che include il componente Solr, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components. Il comando di esempio di seguito utilizza il flag facoltativo properties per impostare un percorso di Cloud Storage come directory home del Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Aggiungi la --properties="dataproc:solr.gcs.path=gs://bucket-name/" proprietà cluster al comando gcloud dataproc clusters create per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr (home directory Solr).

API REST

Il componente Solr può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

  1. Attiva il componente e il gateway del componente.
    • Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Viene selezionato il riquadro Configura cluster.
    • Nella sezione Componenti: