L'installation du composant HBase facultatif est limitée aux clusters Dataproc créés avec la version d'image 1.5 ou 2.0.
Bien que Google Cloud propose de nombreux services qui vous permettent de déployer Apache HBase autogéré, Bigtable est souvent la meilleure option, car il fournit une API ouverte avec HBase et la portabilité des charges de travail. Les tables de base de données HBase peuvent être migrées vers Bigtable pour gérer les données sous-jacentes, tandis que les applications qui interopéraient auparavant avec HBase, comme Spark, peuvent rester sur Dataproc et se connecter de manière sécurisée à Bigtable. Dans ce guide, nous vous fournissons les étapes générales pour commencer à utiliser Bigtable et des références pour migrer des données vers Bigtable à partir de déploiements HBase Dataproc.
Premiers pas avec Bigtable
Cloud Bigtable est une plate-forme NoSQL hautement évolutive et performante qui offre une compatibilité client avec l'API Apache HBase et une portabilité pour les charges de travail HBase. Le client est compatible avec les versions 1.x et 2.x de l'API HBase. Il peut être inclus avec l'application existante pour lire et écrire dans Bigtable. Les applications HBase existantes peuvent ajouter la bibliothèque cliente Bigtable HBase pour lire et écrire les données stockées dans Bigtable.
Pour en savoir plus sur la configuration de votre application HBase avec Bigtable, consultez la section Bigtable et API HBase.
Créer un cluster Bigtable
Pour commencer à utiliser Bigtable, vous pouvez créer un cluster et des tables pour stocker les données qui étaient auparavant stockées dans HBase. Suivez les étapes décrites dans la documentation Bigtable pour créer une instance, un cluster et des tables ayant le même schéma que les tables HBase. Pour créer automatiquement des tables à partir de DDL de table HBase, consultez l'outil de traduction de schéma.
Ouvrez l'instance Bigtable dans la console Google Cloud pour afficher la table et les graphiques de surveillance côté serveur, y compris les lignes par seconde, la latence et le débit, afin de gérer la table nouvellement provisionnée. Pour en savoir plus, consultez la section Surveillance.
Migrer des données de Dataproc vers Bigtable
Une fois que vous avez créé les tables dans Bigtable, vous pouvez importer et valider vos données en suivant les instructions de la section Migrer HBase sur Google Cloud vers Bigtable. Après avoir migré les données, vous pouvez mettre à jour les applications pour envoyer des lectures et des écritures à Bigtable.
Étape suivante
- Consultez les exemples Spark Wordcount pour exécuter Spark avec Bigtable.
- Consultez les options de migration en ligne avec la réplication en temps réel de HBase vers Bigtable.
- Regardez la vidéo Comment Box a modernisé ses bases de données NoSQL pour découvrir d'autres avantages.