Composant HBase facultatif Dataproc

Vous pouvez installer des composants supplémentaires tels que HBase lorsque vous créez un cluster Dataproc à l'aide de la fonctionnalité Composants facultatifs de Dataproc version 1.5 ou Dataproc version 2.0. Toutefois, le composant Apache HBase n'est pas recommandé pour une utilisation sur Dataproc en raison de la nature éphémère des clusters Dataproc.

Alors que Google Cloud fournit de nombreux services permettant de déployer Apache HBase autogéré, Cloud Bigtable est souvent la meilleure option, car il fournit une API ouverte avec HBase et une portabilité des charges de travail. Les tables de base de données HBase peuvent être migrées vers Bigtable pour la gestion des données sous-jacentes, tandis que les applications qui ont précédemment interagi avec HBase, telles que Spark, peuvent rester sur Dataproc et se connecter de manière sécurisée à Bigtable. Dans ce guide, nous vous indiquons les grandes étapes à suivre pour commencer à utiliser Bigtable, ainsi que des références pour la migration de données vers Bigtable à partir de déploiements Dataproc HBase.

Premiers pas avec Bigtable

Cloud Bigtable est une plate-forme NoSQL hautement évolutive et performante qui offre la compatibilité des clients de l'API Apache HBase et la portabilité pour les charges de travail HBase. Le client est compatible avec les versions 1.x et 2.x de l'API HBase. Il peut être inclus dans l'application existante pour lire et écrire dans Bigtable. Les applications HBase existantes peuvent ajouter la bibliothèque cliente HBase Bigtable pour lire et écrire des données stockées dans Bigtable.

Pour en savoir plus sur la configuration de votre application HBase avec Bigtable, consultez la page Bigtable et l'API HBase.

Créer un cluster Bigtable

Vous pouvez commencer à utiliser Bigtable en créant un cluster et des tables pour stocker des données précédemment stockées dans HBase. Suivez les étapes décrites dans la documentation de Bigtable pour créer une instance, un cluster et des tables avec le même schéma que les tables HBase. Pour créer automatiquement des tables à partir de liens profonds différés de table HBase, reportez-vous à l'outil de traduction de schéma.

Ouvrez l'instance Bigtable dans Google Cloud Console pour afficher la table et les graphiques de surveillance côté serveur, y compris les lignes par seconde, la latence et le débit, afin de gérer la nouvelle table. Pour en savoir plus, consultez la page Monitoring.

Migrer des données de Dataproc vers Bigtable

Après avoir créé les tables dans Bigtable, vous pouvez importer et valider vos données en suivant les instructions de la page Migrer HBase vers Google Cloud. Après avoir migré les données, vous pouvez mettre à jour les applications pour envoyer des lectures et des écritures à Bigtable.

Étapes suivantes