Vous pouvez installer des composants supplémentaires tels que Solr lorsque vous créez un cluster Dataproc à l'aide de la fonctionnalité Composants facultatifs. Cette page décrit le composant Solr.
Le composant Apache Solr est une plate-forme de recherche d'entreprise Open Source. Le serveur Solr et l'interface utilisateur Web sont disponibles sur le port 8983
du ou des nœuds maîtres du cluster.
Fichiers Solr persistants : par défaut, Solr écrit et lit les fichiers journaux d'index et de transactions dans HDFS.
Pour conserver les fichiers Solr, utilisez un chemin d'accès Cloud Storage en tant que répertoire d'accueil Solr en définissant la propriété de cluster dataproc:solr.gcs.path
lorsque vous installez le composant.
Installer le composant
Installez le composant lorsque vous créez un cluster Dataproc. Des composants peuvent être ajoutés aux clusters créés avec Dataproc version 1.3 et ultérieure.
Consultez la section Versions Dataproc compatibles pour obtenir la version de composant incluse dans chaque version d'image Dataproc.
Commande gcloud
Pour créer un cluster Dataproc incluant le composant Solr, utilisez la commande cluster-name gcloud dataproc clusters create avec l'option --optional-components
. L'exemple de commande ci-dessous utilise l'option properties
facultative pour définir un chemin d'accès Cloud Storage en tant que répertoire de base Solr.
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \ ... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
à la commande gcloud dataproc clusters create
pour définir un bucket Cloud Storage où les documents Solr seront stockés (répertoire d'accueil Solr).API REST
Le composant Solr peut être spécifié via l'API Dataproc à l'aide de la propriété SoftwareConfig.Component dans le cadre d'une requête clusters.create.
Console
- Activez le composant et la passerelle des composants.
- Dans la console Google Cloud, ouvrez la page Dataproc Créer un cluster. Le panneau "Configurer un cluster" est sélectionné.
- Dans la section Composants :
- Sous "Composants facultatifs", sélectionnez "Solr" et les autres composants facultatifs à installer sur votre cluster.
- Sous "Passerelle des composants", sélectionnez "Activer la passerelle des composants" (consultez la section Afficher les URL de la passerelle des composants et y accéder).