Cette page a été traduite par l'API Cloud Translation.

Ajouter des tables à un job de réplication

Une fois que vous avez déployé une tâche de réplication, vous ne pouvez plus la modifier ni y ajouter de tables. Ajoutez plutôt les tables à une tâche de réplication nouvelle ou en double.

Option 1: Créer une tâche de réplication

L'approche la plus simple consiste à ajouter des tables à une nouvelle tâche. Il empêche le rechargement de l'historique de toutes les tables et évite les problèmes d'incohérence des données.

Les inconvénients sont les coûts supplémentaires liés à la gestion de plusieurs tâches de réplication et la consommation de plus de ressources de calcul, car chaque tâche s'exécute par défaut sur un cluster Dataproc éphémère distinct. Ce dernier peut être atténué dans une certaine mesure en utilisant un cluster Dataproc statique partagé pour les deux tâches.

Pour en savoir plus sur la création de tâches, consultez les tutoriels sur la réplication.

Pour en savoir plus sur l'utilisation d'un cluster Dataproc statique dans Cloud Data Fusion, consultez la page Exécuter un pipeline sur un cluster Dataproc existant.

Option 2: Arrêter la tâche de réplication en cours et créer un double

Si vous dupliquez la tâche de réplication pour ajouter les tables, tenez compte des points suivants:

L'activation de l'instantané pour la tâche en double entraîne le chargement de l'historique de toutes les tables à partir de zéro. Cette option est recommandée si vous ne pouvez pas utiliser l'option précédente, qui consiste à exécuter des tâches distinctes.
Désactiver l'instantané pour empêcher le chargement de l'historique peut entraîner une perte de données, car des événements peuvent être manqués entre l'arrêt de l'ancien pipeline et le démarrage du nouveau. Il est déconseillé de créer un chevauchement pour atténuer ce problème, car cela peut également entraîner une perte de données (les données historiques des nouvelles tables ne sont pas répliquées).

Pour créer une tâche de réplication en double, procédez comme suit:

Arrêtez le pipeline existant.
Sur la page "Tâches de réplication", recherchez la tâche que vous souhaitez dupliquer, cliquez sur , puis sur Dupliquer.
Activez l'instantané:
1. Accédez à Configurer la source.
2. Dans le champ Répliquer les données existantes, sélectionnez Oui.
Ajoutez des tables dans la fenêtre Sélectionner des tables et des transformations, puis suivez l'assistant pour déployer le pipeline de réplication.

Étape suivante

En savoir plus sur la réplication