Composant HBase facultatif de Dataproc

L'installation du composant HBase facultatif est limitée aux clusters Dataproc créés avec la version d'image 1.5 ou 2.0.

Bien que Google Cloud propose de nombreux services qui vous permettent de déployer Apache HBase autogéré, Bigtable est souvent la meilleure option, car il fournit une API ouverte avec HBase et la portabilité des charges de travail. Les tables de base de données HBase peuvent être migrées vers Bigtable pour gérer les données sous-jacentes, tandis que les applications qui interagissaient auparavant avec HBase, telles que Spark, peuvent rester sur Dataproc et se connecter de manière sécurisée à Bigtable. Dans ce guide, nous vous présentons les étapes générales pour commencer à utiliser Bigtable et nous vous fournissons des références pour migrer des données vers Bigtable à partir de déploiements Dataproc HBase.

Premiers pas avec Bigtable

Cloud Bigtable est une plate-forme NoSQL très évolutive et performante qui offre la compatibilité avec le client de l'API Apache HBase et la portabilité pour les charges de travail HBase. Le client est compatible avec les versions 1.x et 2.x de l'API HBase. Il peut être inclus dans l'application existante pour lire et écrire dans Bigtable. Les applications HBase existantes peuvent ajouter la bibliothèque cliente Bigtable HBase pour lire et écrire des données stockées dans Bigtable.

Pour en savoir plus sur la configuration de votre application HBase avec Bigtable, consultez Bigtable et l'API HBase.

Créer un cluster Bigtable

Pour commencer à utiliser Bigtable, vous pouvez créer un cluster et des tables pour stocker les données qui étaient auparavant stockées dans HBase. Suivez les étapes de la documentation Bigtable pour créer une instance, un cluster et des tables avec le même schéma que les tables HBase. Pour créer automatiquement des tables à partir de DDL de tables HBase, consultez l'outil de traduction de schéma.

Ouvrez l'instance Bigtable dans la console Google Cloud pour afficher le tableau et les graphiques de surveillance côté serveur, y compris les lignes par seconde, la latence et le débit, afin de gérer le tableau nouvellement provisionné. Pour en savoir plus, consultez la section Surveillance.

Migrer des données de Dataproc vers Bigtable

Après avoir créé les tables dans Bigtable, vous pouvez importer et valider vos données en suivant les instructions de la page Migrer HBase sur Google Cloud vers Bigtable. Une fois les données migrées, vous pouvez mettre à jour les applications pour envoyer des lectures et des écritures à Bigtable.

Étapes suivantes