Composant Dataproc HBase

Vous pouvez installer des composants supplémentaires lorsque vous créez un cluster Dataproc à l'aide de la fonctionnalité Composants facultatifs. Cette page décrit le composant HBase.

Le composant Apache HBase est la base de données Hadoop: un magasin de big data distribué, évolutif. Le serveur HBase et l'interface utilisateur Web sont disponibles sur le port 16010 du premier nœud maître du cluster Dataproc. Vous pouvez appeler la CLI HBase (interface de ligne de commande) avec la commande hbase shell depuis une fenêtre de terminal située sur le premier nœud maître du cluster.

Installer le composant

Installez le composant lorsque vous créez un cluster Dataproc. Le composant Hbase peut être ajouté aux clusters créés avec Dataproc version 1.5 et ultérieure. Le composant HDFS nécessite l'installation du composant ZooKeeper, comme illustré dans la CLI Google Cloud et les exemples de console ci-dessous.

Consultez la section Versions Dataproc compatibles pour obtenir la version de composant incluse dans chaque version d'image Dataproc.

Commande gcloud

Pour créer un cluster Dataproc incluant le composant HCL, utilisez la commande gcloud beta dataproc clusters create cluster-name avec les options --region et --optional-components.

gcloud beta dataproc clusters create cluster-name \
    --optional-components=HBASE,ZOOKEEPER \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

Les composants HCL Keep et ZooKeeper peuvent être spécifiés via l'API Dataproc à l'aide de SoftwareConfig.Component dans le cadre d'une requête clusters.create.

Console

  1. Activez le composant et la passerelle des composants.
    • Dans Cloud Console, ouvrez la page Dataproc Create a cluster (Créer un cluster). Le panneau "Configurer un cluster" est sélectionné.
    • Dans la section"Composants" :
      • Sous "Composants facultatifs", sélectionnez "HBase", "ZooKeeper" et d'autres composants facultatifs à installer sur votre cluster.
      • Sous "Passerelle des composants", sélectionnez "Activer la passerelle des composants".

Ouvrir l'interface utilisateur d'Apache HBase

Dans la console Cloud, cliquez sur HBase dans les liens de la passerelle des composants Cloud Console pour ouvrir l'interface utilisateur d'Apache HBase.

Définir les propriétés de configuration HBase

Bien que les paramètres de configuration HBase Dataproc par défaut soient suffisants pour la plupart des applications, vous pouvez modifier les paramètres de configuration HBase lorsque vous créez des propriétés de cluster à l'aide du préfixe de fichier hbase:.

Exemple de commande gcloud pour définir hbase.rootdir dans hbase-site.xml:

gcloud beta dataproc clusters create my-cluster \
    --optional-components=HBASE,ZOOKEEPER \
    --properties=hbase:hbase.rootdir=hdfs://...
    ... other flags (see Installing the component)