Récupérer un flux

Vous pouvez récupérer un flux qui a échoué de manière permanente sans avoir à en créer un autre. Pour ce faire, spécifiez la position à partir de laquelle Datastream tente de reprendre la lecture des modifications à partir de la source.

Présentation de la récupération de flux

Un flux en cours d'exécution peut rencontrer des erreurs irrécupérables et modifier son état sur FAILED_PERMANENTLY. Ces erreurs empêchent le flux de continuer à s'exécuter et peuvent entraîner une perte de données.

Vous pouvez récupérer un flux qui a échoué définitivement en le configurant pour qu'il ignore l'erreur et continue de lire les événements en cours au lieu de recréer le flux et de remplir l'historique des données. Pour récupérer un flux qui a échoué de manière permanente, vous devez réinitialiser la réplication afin de commencer à lire à partir d'une autre position de réplication. Chaque type de source compatible a sa propre définition de ce qu'est une position de réplication:

  • Pour les sources Oracle, une position de réplication est un fichier journal de rétablissement dans la base de données et le numéro de modification système (SCN) dans ce fichier.
  • Pour les sources MySQL, une position de réplication correspond au fichier de journal binaire (binlog) de la base de données et à la position dans ce fichier.
  • Pour les sources SQL Server, une position de réplication correspond au numéro séquentiel de journal (LSN) dans les journaux de transactions ou les tables de modifications.
  • Pour les sources PostgreSQL (y compris AlloyDB pour PostgreSQL), une position de réplication correspond au numéro de séquence de journal (LSN) dans l'emplacement de réplication. Lors de la récupération, le flux commence à lire à partir du premier LSN de l'emplacement de réplication.

Récupérer un flux pour une source MySQL ou Oracle

Pour récupérer un flux pour une source MySQL ou Oracle, vous avez les options suivantes:

  • Réessayer à partir de la position actuelle (recommandé): sélectionnez cette option pour tenter de diffuser à partir de la position actuelle, où la diffusion a échoué pour la dernière fois. Vous devez d'abord corriger le fichier journal ou le récupérer à partir d'une sauvegarde. Il s'agit de l'option recommandée.

  • Ignorer la position actuelle et lancer la diffusion à partir de la prochaine position disponible: si un ou plusieurs fichiers journaux sont manquants, sélectionnez cette option pour les ignorer et reprendre la diffusion à partir de la première position du fichier disponible suivant. Les modifications consignées dans les fichiers journaux manquants sont perdues, mais vous pouvez les récupérer en effectuant un remplissage.

  • Ignorer la position actuelle et lancer la diffusion à partir de la position la plus récente: si un ou plusieurs fichiers journaux sont manquants, sélectionnez cette option pour les ignorer et reprendre la diffusion à partir de la position la plus récente du fichier journal le plus à jour. Les modifications consignées dans les fichiers journaux manquants sont perdues, mais vous pouvez les récupérer en effectuant un remplissage.

  • Reprendre la diffusion à partir du fichier et de la position de votre choix: sélectionnez cette option pour reprendre le flux à partir d'un fichier journal et d'une position de journal spécifiques. Certaines modifications peuvent être perdues si la position dans le journal spécifiée ne chevauche pas ou ne suit pas immédiatement la position perdue. Vous pouvez récupérer ces modifications en effectuant un remplissage.

Pour récupérer un flux ayant échoué de manière permanente pour une source MySQL ou Oracle, procédez comme suit:

  1. Accédez à la page Flux de Google Cloud.

    Accéder à la page "Flux"

  2. Cliquez sur Récupérer dans la ligne correspondant au nom du flux que vous souhaitez récupérer.

  3. Le volet Choisir une stratégie de récupération s'ouvre. Sélectionnez une option. Si vous sélectionnez Reprendre la diffusion à partir du fichier et de la position de votre choix, saisissez les informations suivantes:

    • Pour une source MySQL: le nom du fichier journal dans le champ Nom de fichier et la position du journal dans le champ Position. Si vous ne spécifiez pas de position, le flux reprend à partir de la première position du fichier journal indiqué.
    • Pour une source Oracle: le numéro de modification du système (SCN) dans le champ Numéro de modification du système (SCN). Ce champ est obligatoire.
  4. Cliquez sur Appliquer.

  5. Lorsque le flux est récupéré, un code temporel s'affiche dans la colonne Recovered (Récupéré) de la page Streams (Flux).

Récupérer un flux pour une source PostgreSQL

Pour récupérer un flux pour une source PostgreSQL, vous devez indiquer le nom de l'emplacement de réplication. Le serveur utilise cet emplacement de réplication pour envoyer des événements à Datastream. Le nom de l'emplacement de réplication peut être identique à celui de l'emplacement utilisé pour le flux ayant échoué ou différent:

  • Si le nouveau nom de l'emplacement de réplication est différent, indiquez-le à Datastream.
  • Si vous ne fournissez pas de nom d'emplacement de réplication, Datastream utilise le nom d'emplacement de réplication spécifié dans la configuration source.

    Pour en savoir plus sur les emplacements de réplication, consultez la section Configurer une base de données PostgreSQL source.

Tous les événements de modification de la source qui se sont produits entre la perte de position dans le journal et le premier LSN dans le nouvel emplacement de réplication sont perdus. Vous pouvez récupérer ces modifications en effectuant un remplissage.

Pour récupérer un flux ayant échoué de manière permanente pour une source PostgreSQL, procédez comme suit:

  1. Accédez à la page Flux de Google Cloud.

    Accéder à la page "Flux"

  2. Cliquez sur Récupérer dans la ligne correspondant au nom du flux que vous souhaitez récupérer.

  3. Le volet Définir un nouvel emplacement de réplication s'ouvre.

  4. Dans le champ Nom de l'emplacement de réplication, indiquez le nom d'un nouvel emplacement de réplication à partir duquel le flux tentera de récupérer. Si vous avez recréer l'emplacement de réplication avec le même nom ou si vous souhaitez réutiliser l'emplacement que vous avez spécifié lorsque vous avez configuré votre source, vous pouvez laisser ce champ vide.

  5. Cliquez sur Appliquer.

  6. Lorsque le flux est récupéré, un code temporel s'affiche dans la colonne Recovered (Récupéré) de la page Streams (Flux).

Vous pouvez également récupérer les flux en échec permanents à partir de la page Détails du flux. Pour ce faire, cliquez sur Recuperer le flux lorsque vous consultez des informations détaillées sur votre flux.

Récupérer un flux pour une source SQL Server

Pour récupérer un flux pour une source SQL Server, vous avez les options suivantes:

  • Reprendre à partir de la première position disponible: sélectionnez cette option si le journal a été tronqué ou si des enregistrements sont manquants dans les tables de modification, et que vous souhaitez reprendre à partir du premier événement disponible. Les événements manquants sont perdus, mais vous pouvez les récupérer en effectuant un remplissage.

  • Reprendre à partir du numéro de séquence de journal (LSN) de votre choix: sélectionnez cette option pour reprendre le flux à partir d'un numéro de séquence de journal (LSN) spécifique dans les journaux de transactions ou les tables de modifications. Certains événements peuvent être perdus si le LSN spécifié ne chevauche pas ou ne suit pas immédiatement le LSN que Datastream a été en mesure de récupérer. Vous pouvez récupérer ces événements en effectuant un remplissage.

    Le LSN des journaux de transactions et des tables de modifications contient 20 caractères hexadécimaux, mais pour les journaux de transactions, il est séparé par un séparateur. Exemple :

    • LSN dans les journaux de transactions: 0000123C:0000BA78:0004
    • LSN dans les tables de modifications: 0000123C0000BA780004

Pour récupérer un flux ayant échoué de manière permanente pour une source SQL Server, procédez comme suit:

  1. Accédez à la page Flux de Google Cloud.

    Accéder à la page "Flux"

  2. Cliquez sur Récupérer dans la ligne correspondant au nom du flux que vous souhaitez récupérer.

  3. Le volet Choisir une stratégie de récupération s'ouvre. Sélectionnez une option.

  4. Cliquez sur Appliquer.

  5. Lorsque le flux est récupéré, un code temporel s'affiche dans la colonne Recovered (Récupéré) de la page Streams (Flux).

Utiliser la récupération de flux pour une source MySQL dans un scénario de basculement manuel

Vous pouvez effectuer un basculement manuel et utiliser la récupération de flux pour éviter de recréer vos flux à partir de zéro lors de la maintenance ou en cas d'échec de l'instance principale. En général, Datastream n'est pas compatible avec les basculements vers des réplicas, car ils rompent la continuité du journal binaire. Toutefois, vous pouvez suivre ces étapes pour récupérer le flux et vous assurer que vos données de modification sont capturées:

  1. Arrêtez toutes les opérations en écriture sur l'instance principale.
  2. Assurez-vous que la métrique de fraîcheur des données est définie sur 0. Cela signifie que Datastream a capturé toutes les modifications et qu'il n'y a pas de nouveaux événements à lire à partir de la source. Pour en savoir plus, consultez la section Surveiller un flux.
  3. Effectuer un basculement vers la nouvelle instance de base de données.
  4. Si nécessaire, mettez à jour le profil de connexion du flux avec la nouvelle instance de base de données (par exemple, vous devrez peut-être modifier le nom d'hôte ou l'adresse IP de la base de données). Pour en savoir plus, consultez Modifier les profils de connexion.
  5. Récupérez le flux à partir d'une position spécifique sur l'instance de basculement pour assurer la continuité de la CDC.

Étape suivante