Puoi installare componenti aggiuntivi come Solr quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Solr.
Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e
Le UI web sono disponibili sulla porta 8983
nei nodi master del cluster.
File Solr persistenti: per impostazione predefinita, Solr scrive e legge l'indice e
i file di log delle transazioni
HDFS.
Per mantenere i file Solr, utilizza un percorso Cloud Storage come home directory di Solr impostando la dataproc:solr.gcs.path
proprietà cluster quando installi il componente.
Installa il componente
Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successivi.
Consulta Versioni Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.
Comando g-cloud
Per creare un cluster Dataproc che includa il componente Solr,
utilizza la
gcloud dataproc clusters create cluster-name
con il flag --optional-components
. Il comando di esempio riportato di seguito utilizza l'attributo facoltativo properties
per impostare un percorso Cloud Storage come home directory Solr.
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \ ... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
del cluster alla gcloud dataproc clusters create
per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr
(Home directory di Solr).API REST
Il componente Solr può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.
Console
- Attiva il componente e il gateway dei componenti.
- Nella console Google Cloud, apri la pagina Dataproc Crea un cluster. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Solr e altri componenti da installare sul cluster.
- In Gateway dei componenti, seleziona Attiva gateway dei componenti (consulta Visualizzare e accedere agli URL del gateway dei componenti).