Configurer les ressources pour la migration

Cette page décrit la partie préparation du processus de migration, qui consiste à configurer les ressources pour la migration.

À ce stade, vous allez effectuer les opérations suivantes :

  1. Installez les outils de ligne de commande nécessaires pour exécuter des commandes lors des étapes ultérieures du processus de migration.
  2. Configurez une base de données Firestore compatible avec MongoDB.
  3. (Facultatif) Ajustez les paramètres du journal des opérations (oplog) sur votre source compatible avec MongoDB.
  4. Créez un bucket Cloud Storage pour stocker les données intermédiaires.

Configurer les autorisations IAM

Votre compte doit disposer des rôles IAM appropriés dans tous les services utilisés lors du processus de migration :

Installer les outils de ligne de commande

La procédure de migration utilise la gcloud CLI pour configurer et exécuter les étapes de migration. Si nécessaire, installez gcloud CLI en suivant les instructions de la page Installer la CLI gcloud.

Configuration spécifique à la source

MongoDB sur Compute Engine

Une base de données MongoDB qui s'exécute sur des VM Compute Engine dans un cluster autogéré n'est normalement pas exposée à l'Internet public. La procédure de migration utilisera Private Service Connect dans Datastream pour connecter le pipeline Datastream à votre base de données source.

Procédez comme suit :

  1. Configurez la connectivité privée Datastream en suivant les instructions de la section Créer une configuration de connectivité privée.

  2. Notez le paramètre Configuration ID de la configuration créée. Vous l'utiliserez lors des étapes ultérieures pour configurer les variables d'environnement requises.

Azure Cosmos DB

Assurez-vous que l'interface de ligne de commande Azure est installée sur votre ordinateur.

Amazon DocumentDB

Les clusters Amazon DocumentDB ne sont pas directement accessibles depuis l'extérieur du réseau Amazon VPC. Pour vous connecter à un cluster DocumentDB, vous devez provisionner une instance EC2 dans le réseau Amazon VPC et l'utiliser comme hôte bastion pour un tunnel SSH.

Consultez le guide du développeur Se connecter à un cluster Amazon DocumentDB depuis l'extérieur d'un Amazon VPC pour savoir comment configurer une instance EC2 pour la connectivité externe à DocumentDB.

Pour établir une connexion au cluster DocumentDB, vous devrez obtenir la clé SSH privée de l'instance EC2 ainsi que le bundle de certificats approprié pour la région dans laquelle votre cluster est déployé. Consultez la page de ressources Packs de certificats par région AWS pour télécharger le pack approprié au format PEM.

Notez que le bundle de certificats contient plusieurs certificats. Vous devez extraire un seul certificat pour configurer une connexion Datastream. Nous vous recommandons de valider manuellement la connectivité DocumentDB pour vous assurer de disposer d'une clé SSH et d'un certificat DocumentDB valides provenant du bundle régional. Le guide du développeur DocumentDB fournit des exemples de ligne de commande pour établir une connexion directe depuis l'extérieur du VPC.

Configurer une base de données Firestore compatible avec MongoDB comme destination

  1. Assurez-vous que votre projet dispose d'une base de données Firestore compatible avec MongoDB dans laquelle vous migrerez les données de votre base de données Mongo source. Pour en savoir plus sur la création d'une base de données, consultez Créer et gérer des bases de données.

  2. Pour cette migration, nous vous recommandons de créer un nom d'utilisateur et un mot de passe pour la base de données Firestore avec compatibilité MongoDB à utiliser avec le protocole d'authentification SCRAM-SHA-256. Ce nom d'utilisateur peut être supprimé sans risque une fois la migration terminée. Vous pouvez également choisir de continuer à utiliser ces identifiants pour connecter vos clients Mongo à votre nouvelle base de données Firestore avec compatibilité MongoDB.

Vous utiliserez le nom de cette base de données Firestore avec compatibilité MongoDB et les identifiants utilisateur lors des étapes suivantes.

Ajuster la taille de la fenêtre oplog de la base de données source

Nous vous recommandons d'ajuster la fenêtre oplog de votre base de données Mongo source à trois jours de trafic d'écriture total vers cette base de données. Si le taux de trafic en écriture dépasse la vitesse à laquelle Datastream peut consommer les modifications de votre base de données, cet ajustement empêchera la perte de données.

Il faudra peut-être ajuster davantage cette valeur en fonction du modèle de trafic et du volume de trafic de pointe. Par exemple, si une semaine de trafic est enregistrée sur une courte période, Datastream peut ne pas capturer les modifications de l'oplog assez rapidement avant qu'elles ne sortent de la fenêtre de l'oplog. Dans ce cas, vous devrez peut-être redimensionner la fenêtre oplog pour qu'elle corresponde à sept jours de trafic d'écriture total.

Créer un bucket Cloud Storage

Créez un bucket Cloud Storage :

  1. Choisissez une région Cloud Storage dans laquelle le pipeline de migration sera exécuté. Nous vous recommandons d'utiliser la région dans laquelle se trouve votre base de données Firestore compatible avec MongoDB de destination.

  2. Choisissez un nom pour ce bucket. Exemple : mongo-migration-bucket. Vous utiliserez ce nom lors des prochaines étapes.

  3. Créez un bucket Cloud Storage avec le nom et dans la région de votre choix en suivant les instructions de la page Créer un bucket de la documentation Cloud Storage.

Étapes suivantes

Passez à l'étape Configurer les variables d'environnement.