Composant Druid facultatif Dataproc

Vous pouvez installer des composants supplémentaires tels que Druid lorsque vous créez un cluster Dataproc à l'aide de la fonctionnalité Composants facultatifs. Cette page décrit le composant Druid.

Le composant Apache Druid est un datastore OLAP Open Source distribué. Il installe les services Druid sur les nœuds maîtres (Coordinator, Broker et Overlord) et les nœuds de calcul (Historical, Realtime et MiddleManager) d'un cluster Dataproc. Le composant Druid utilise Zookeeper pour gérer la coordination.

Installer le composant

Installez le composant lorsque vous créez un cluster Dataproc. Des composants peuvent être ajoutés aux clusters créés avec Dataproc version 1.3 et ultérieure. Le composant Druid nécessite l'installation du composant Zookeeper (comme illustré dans l'exemple du Google Cloud CLI ci-dessous).

Consultez la section Versions Dataproc compatibles pour obtenir la version de composant incluse dans chaque version d'image Dataproc.

Commande gcloud

Pour créer un cluster Dataproc incluant le composant Presto, utilisez la commande gcloud dataproc clusters create cluster-name avec l'option --optional-components.

gcloud beta dataproc clusters create cluster-name \
    --optional-components=DRUID,ZOOKEEPER \
    --region=region \
    ... other flags

API REST

Le composant Druid peut être spécifié via l'API Dataproc à l'aide de la propriété SoftwareConfig.Component dans le cadre d'une requête clusters.create.

Console

  1. Activez le composant.
    • Dans la console Google Cloud, ouvrez la page Dataproc Créer un cluster. Le panneau "Configurer un cluster" est sélectionné.
    • Dans la section "Composants", sous "Composants facultatifs", sélectionnez "Druid", "ZooKeeper" et d'autres composants facultatifs à installer sur votre cluster.

Accéder à Druid

Les services Druid Overlord, Coordinator et Broker sont configurés sur le nœud maître d'un cluster Dataproc créé avec le composant Druid installé. Ces services sont hébergés sur les ports de nœud maître suivants :

Service Port
Overlord 8092
Coordinateur 8081
Broker 8082

Les services Druid Middlemanager et Historical sont configurés sur le nœud maître d'un cluster Dataproc créé avec le composant Druid installé. Ces services sont hébergés sur les ports de nœuds de calcul suivants :

Service Port
Middlemanager 8091
Historique 8083

Pour le moment, Druid n'est pas intégré à la passerelle des composants Dataproc. Pour accéder aux UI Web de Druid Coordinator ou d'Overlord, créez un tunnel SSH vers le port du service sur le nœud maître.