É possível instalar outros componentes, como o Solr, ao criar um cluster do Dataproc usando o recurso Componentes opcionais. Esta página descreve o componente Solr.
O componente Apache Solr é uma plataforma de pesquisa corporativa de código aberto. O servidor Solr e a IU da Web estão disponíveis na porta 8983
nos nós mestres do cluster.
Arquivos Solr permanentes: por padrão, o Solr grava e lê os arquivos de registro de índice e de transações no HDFS.
Para manter arquivos Solr, use um caminho do Cloud Storage como o diretório inicial do Solr definindo a propriedade de cluster dataproc:solr.gcs.path
quando você instalar o componente.
Instalar o componente
Instale o componente ao criar um cluster do Dataproc. Os componentes podem ser adicionados aos clusters criados com o Dataproc versão 1.3 ou posterior.
Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.
Para criar um cluster do Dataproc que inclua o componente Solr, use o comando gcloud dataproc clusters create cluster-name com a sinalização --optional-components
. O comando de amostra abaixo usa a sinalização opcional properties
para definir um caminho do Cloud Storage como o diretório inicial do Solr.
gcloud dataproc clusters createcluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
ao comando gcloud dataproc clusters create
para definir um bucket do Cloud Storage em que os documentos do Solr serão armazenados
(diretório inicial do Solr).O componente Solr pode ser especificado por meio de API do Dataproc usando SoftwareConfig.Component como parte de uma solicitação clusters.create.
- Ative o componente e o gateway de componentes.
- No console do Google Cloud, abra a página Criar um cluster do Dataproc. O painel "Configurar cluster" está selecionado.
- Na seção "Componentes:"
- Em "Componentes opcionais", selecione "Solr" e outros componentes opcionais para instalar no cluster.
- Em "Gateway de componentes", selecione "Ativar gateway do componente" (consulte Visualizar e acessar URLs do gateway de componentes).