Puoi installare componenti aggiuntivi come Solr quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Solr.
Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e
l'interfaccia utente web sono disponibili sulla porta 8983
nei nodi master del cluster.
File Solr permanenti: per impostazione predefinita, Solr scrive e legge i file di log di transazioni e dell'indice in HDFS.
Per mantenere i file Solr, utilizza un percorso Cloud Storage come home directory di Solr impostando la dataproc:solr.gcs.path
proprietà cluster quando installi il componente.
Installa il componente
Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successive.
Consulta Versioni Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.
Per creare un cluster Dataproc che includa il componente Solr,
utilizza il comando
gcloud dataproc clusters create cluster-name
con il flag --optional-components
. Il comando di esempio riportato di seguito utilizza il flag facoltativo properties
per impostare un percorso Cloud Storage come home directory di Solr.
gcloud dataproc clusters createcluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
cluster al comando gcloud dataproc clusters create
per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr
(home directory di Solr).Il componente Solr può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.
- Attiva il componente e il gateway dei componenti.
- Nella console Google Cloud, apri la pagina Dataproc Crea un cluster. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Solr e altri componenti facoltativi da installare sul cluster.
- In Gateway dei componenti, seleziona Attiva gateway dei componenti (consulta Visualizzare e accedere agli URL del gateway dei componenti).