Récupérer un flux

Vous pouvez récupérer un flux en échec permanent sans avoir à en créer un autre. Pour ce faire, spécifiez la position à partir de laquelle Datastream tente pour reprendre la lecture des modifications à partir de la source.

Présentation de la récupération de flux

Un flux en cours d'exécution peut rencontrer des erreurs irrécupérables et faire passer son état à FAILED_PERMANENTLY De telles erreurs empêchent le flux de continuer à s'exécuter, et peut entraîner une perte de données.

Vous pouvez récupérer un flux qui a définitivement échoué en le configurant pour qu'il ignore l'erreur et continuez à lire les événements en cours au lieu de recréer la diffusion et de remplir les données historiques. Pour récupérer un flux qui a échoué de manière permanente, vous devez réinitialiser la réplication afin de commencer à lire à partir d'une autre position de réplication. Chacune d'entre elles type de source a sa propre définition de ce qu'est une position de réplication:

  • Pour les sources Oracle, une position de réplication est un fichier journal de rétablissement. dans la base de données et le numéro de modification du système (SCN) de ce fichier.
  • Pour les sources MySQL, une position de réplication correspond au fichier de journal binaire (binlog) de la base de données et à la position dans ce fichier.
  • Pour les sources SQL Server, une position de réplication correspond au numéro de séquence du journal (LSN) dans les journaux de transactions ou les tables de modifications.
  • Pour les sources PostgreSQL (y compris AlloyDB pour PostgreSQL) : une position de réplication est le numéro de séquence du journal (LSN) dans l'emplacement de réplication. Lors de la récupération, le flux commence à lire à partir du premier LSN dans l'emplacement de réplication.

Récupérer un flux pour une source MySQL ou Oracle

Pour récupérer un flux pour une source MySQL ou Oracle, vous avez les options suivantes :

  • Réessayer à partir de la position actuelle (recommandé): sélectionnez cette option pour tentative de streaming à partir de la position actuelle, où le dernier échec du flux Vous devez d'abord corriger le fichier journal ou le récupérer à partir d'une sauvegarde. Il s'agit de l'option recommandée.

  • Ignorer la position actuelle et lancer la diffusion à partir de la prochaine position disponible : si un ou plusieurs fichiers journaux sont manquants, sélectionnez cette option pour les ignorer et reprendre la diffusion à partir de la première position du fichier disponible suivant. La les modifications des fichiers journaux manquants sont perdues, mais vous pouvez les récupérer en un remplissage.

  • Ignorer la position actuelle et lancer la diffusion à partir de la position la plus récente : si un ou plusieurs fichiers journaux sont manquants, sélectionnez cette option pour les ignorer et reprendre la diffusion à partir de la position la plus récente du fichier journal le plus à jour. Les modifications consignées dans les fichiers journaux manquants sont perdues, mais vous pouvez les récupérer en effectuant un remplissage.

  • Reprendre la diffusion à partir du fichier et de la position de votre choix : sélectionnez cette option pour reprendre le flux à partir d'un fichier journal et d'une position de journal spécifiques. Certaines modifications peuvent être perdues si la position dans le journal spécifiée ne chevauche pas ou ne suit pas immédiatement la position perdue. Vous pouvez récupérer ces modifications en effectuant un remplissage.

Pour récupérer un flux ayant échoué de manière permanente pour une source MySQL ou Oracle, procédez comme suit :

  1. Accédez à la page Flux dans Google Cloud.

    Accéder à la page "Flux"

  2. Cliquez sur Récupérer dans la ligne correspondant au nom du flux que vous souhaitez récupérer.

  3. Le volet Choisir une stratégie de récupération s'ouvre. Sélectionnez une option. Si vous sélectionnez Reprendre la diffusion à partir du fichier et de la position de votre choix, saisissez les informations suivantes :

    • Pour une source MySQL : le nom du fichier journal dans le champ Nom du fichier et la position du journal dans le champ Position. Si vous ne spécifiez pas de position, le flux reprend à partir de la première position du fichier journal indiqué.
    • Pour une source Oracle: le numéro de modification du système (SCN) dans le champ System Change Change Numéro (SCN). Ce champ est obligatoire.
  4. Cliquez sur Appliquer.

  5. Lorsque le flux est récupéré, un code temporel apparaît dans la colonne Recovered (Récupéré) sur la page Flux.

Récupérer un flux pour une source PostgreSQL

Pour récupérer un flux pour une source PostgreSQL, vous devez fournir la réplication nom de l'emplacement. Le serveur utilise cet emplacement de réplication pour envoyer des événements à Datastream. Le nom de l'emplacement de réplication peut être identique à celui de l'emplacement utilisé pour le flux ayant échoué ou différent :

  • Si le nouveau slot de réplication porte un nom différent, indiquez-le à Datastream.
  • Si vous ne fournissez pas de nom d'emplacement de réplication, Datastream utilise le nom d'emplacement de réplication spécifié dans la configuration source.

    Pour en savoir plus sur les emplacements de réplication, consultez Configurez une base de données PostgreSQL source.

Tous les événements de modification de la source qui se sont produits entre la perte de position dans le journal et le premier LSN du nouvel emplacement de réplication sont perdus. Vous pouvez récupérer ces modifications en effectuant un remplissage.

Pour récupérer un flux qui a définitivement échoué pour une source PostgreSQL, exécutez la en suivant les étapes ci-dessous:

  1. Accédez à la page Flux dans Google Cloud.

    Accéder à la page "Flux"

  2. Cliquez sur Récupérer sur la ligne contenant le nom du flux que vous souhaitez récupérer.

  3. Le volet Définir un nouvel emplacement de réplication s'ouvre.

  4. Dans le champ Nom de l'emplacement de réplication, indiquez le nom d'une nouvelle réplication emplacement à partir duquel le flux tentera de récupérer. Si vous avez recréer l'emplacement de réplication avec le même nom ou si vous souhaitez réutiliser l'emplacement que vous avez spécifié lorsque vous avez configuré votre source, vous pouvez laisser ce champ vide.

  5. Cliquez sur Appliquer.

  6. Lorsque le flux est récupéré, un code temporel apparaît dans la colonne Recovered (Récupéré) sur la page Flux.

Vous pouvez également récupérer les flux en échec permanents à partir de la page Détails du flux. Pour ce faire, cliquez sur Récupérer le flux sur la page des informations détaillées. à propos de votre diffusion.

Récupérer un flux pour une source SQL Server

Pour récupérer un flux pour une source SQL Server, vous avez les options suivantes :

  • Resume from the first available position (Reprendre à partir de la première position disponible) : sélectionnez cette option si le journal a été tronqués ou manquants dans les tableaux de modifications, et vous souhaitez reprendre à partir du premier événement disponible. Les événements manquants sont perdus, mais vous pouvez les récupérer en effectuant un remplissage.

  • Reprendre à partir du numéro de séquence de journal (LSN) de votre choix : sélectionnez cette option pour reprendre le flux à partir d'un numéro de séquence de journal (LSN) spécifique dans les journaux de transactions ou les tables de modifications. Certains événements peuvent être perdus si le LSN spécifié ne chevauche pas ou n'est pas immédiatement après le dernier LSN que Datastream a pu récupérer. Vous pouvez récupérer ces événements en effectuant un remplissage.

    Le LSN des journaux de transactions et des tables de modifications contient 20 caractères hexadécimaux, mais pour les journaux de transactions, il est séparé par un séparateur. Exemple :

    • LSN dans les journaux de transactions : 0000123C:0000BA78:0004
    • Numéro séquentiel dans les tables de modifications : 0000123C0000BA780004

Pour récupérer un flux en échec permanent pour une source SQL Server, exécutez la en suivant les étapes ci-dessous:

  1. Accédez à la page Flux dans Google Cloud.

    Accéder à la page "Flux"

  2. Cliquez sur Récupérer dans la ligne correspondant au nom du flux que vous souhaitez récupérer.

  3. Le volet Choisir une stratégie de récupération s'ouvre. Sélectionnez une option.

  4. Cliquez sur Appliquer.

  5. Lorsque le flux est récupéré, un code temporel s'affiche dans la colonne Recovered (Récupéré) de la page Streams (Flux).

Utiliser la récupération de flux pour une source MySQL dans un scénario de basculement manuel

Vous pouvez effectuer un basculement manuel et utiliser la récupération de flux pour éviter de recréer votre lors de la maintenance ou en cas de défaillance de l'instance principale. En règle générale, Datastream n'accepte pas les basculements vers des instances répliquées, car ils rompent la continuité du binlog, mais vous pouvez suivre ces étapes pour récupérer flux et assurez-vous que vos données de modification sont capturées:

  1. Arrêtez toutes les opérations en écriture sur l'instance principale.
  2. Assurez-vous que la métrique de fraîcheur des données est définie sur 0. Cela signifie que Datastream a capturé toutes les modifications et qu'il n'y a pas de nouveaux événements à lire à partir de la source. Pour Pour en savoir plus, consultez Contrôler un flux.
  3. Basculez vers la nouvelle instance de base de données.
  4. Si nécessaire, mettez à jour le profil de connexion du flux avec la nouvelle instance de base de données (par exemple, vous devrez peut-être modifier le nom d'hôte ou l'adresse IP de la base de données). Pour en savoir plus, consultez Modifier les profils de connexion.
  5. Récupérez le flux à partir d'une position spécifique sur l'instance de basculement pour assurer la continuité de la CDC.

Étape suivante