L'installation du composant HBase facultatif est limitée aux clusters Dataproc créés avec les versions d'image 1.5 ou 2.0.
Bien que Google Cloud propose de nombreux services vous permettant de déployer Apache HBase autogéré, Bigtable est souvent la meilleure option, car il fournit une API ouverte avec HBase et la portabilité des charges de travail. Les tables de base de données HBase peuvent être migrées vers Bigtable pour gérer les données sous-jacentes, tandis que les applications qui utilisaient auparavant HBase, telles que Spark, peuvent rester sur Dataproc et se connecter de manière sécurisée à Bigtable. Dans ce guide, nous allons vous expliquer dans les grandes lignes comment démarrer avec Bigtable et vous fournir des références sur la migration de données vers Bigtable à partir de déploiements Dataproc HBase.
Premiers pas avec Bigtable
Cloud Bigtable est une plate-forme NoSQL hautement évolutive et performante qui offre la compatibilité et la portabilité du client pour l'API Apache HBase pour les charges de travail HBase. Le client est compatible avec les versions 1.x et 2.x de l'API HBase, et peut être inclus dans l'application existante pour lire et écrire dans Bigtable. Les applications HBase existantes peuvent ajouter la bibliothèque cliente Bigtable HBase pour lire et écrire les données stockées dans Bigtable.
Pour en savoir plus sur la configuration de votre application HBase avec Bigtable, consultez la page Bigtable et API HBase.
Créer un cluster Bigtable
Vous pouvez commencer à utiliser Bigtable en créant un cluster et des tables pour stocker les données précédemment stockées dans HBase. Suivez les étapes de la documentation Bigtable pour créer une instance, un cluster et des tables avec le même schéma que les tables HBase. Pour créer automatiquement des tables à partir de tables LDD de tables HBase, reportez-vous au traducteur de schéma.
Ouvrez l'instance Bigtable dans la console Google Cloud pour afficher la table et les graphiques de surveillance côté serveur, y compris le nombre de lignes par seconde, la latence et le débit, afin de gérer la table nouvellement provisionnée. Pour en savoir plus, consultez la page Surveillance.
Migrer des données de Dataproc vers Bigtable
Après avoir créé les tables dans Bigtable, vous pouvez importer et valider vos données en suivant les instructions de la page Migrer des données de HBase sur Google Cloud vers Bigtable. Après avoir migré les données, vous pouvez mettre à jour les applications pour qu'elles envoient des données en lecture et en écriture à Bigtable.
Étapes suivantes
- Consultez les exemples Wordcount Spark pour exécuter Spark avec Bigtable.
- Découvrez les options de migration en ligne liées à la réplication à chaud de HBase vers Bigtable.
- Regardez Comment Box a modernisé ses bases de données NoSQL pour comprendre d'autres avantages.