Base de données SQL Server source

Cette page contient des informations sur les éléments suivants:

  • Comportement de la manière dont Datastream gère les données extraites d'une base de données SQL Server source.
  • Versions des bases de données SQL Server compatibles avec Datastream.
  • Limites connues concernant l'utilisation d'une base de données SQL Server en tant que source.

Comportement

Datastream suit les modifications du langage de manipulation de données (LMD) à l'aide de l'une des méthodes CDC suivantes:

Journaux de transactions

Lorsque vous utilisez cette méthode CDC, Datastream lit les modifications dans la source directement à partir des journaux de transactions. Cette méthode nécessite moins de ressources et permet une récupération plus rapide des données, mais elle présente plus de limites.

Pour éviter toute perte de données, il est important que les journaux ne soient pas tronqués avant que Datastream les lise. En revanche, si vous conservez les fichiers journaux trop longtemps, ils occupent de l'espace de stockage, ce qui peut amener l'instance de base de données à passer en mode lecture seule.

Pour vous assurer que le lecteur CDC dispose de suffisamment de temps pour lire les journaux tout en autorisant la troncation des journaux afin de libérer de l'espace de stockage, vous devez appliquer des étapes de configuration supplémentaires, telles que la modification des intervalles d'interrogation et la mise en place d'une protection contre la troncation. Ces étapes fournissent une couche de protection supplémentaire pour garantir que Datastream peut lire les données, même en cas de temps d'arrêt côté Datastream ou de problème de connectivité entre la base de données source et Datastream.

Pour obtenir des instructions détaillées sur l'application de ces mesures supplémentaires, consultez la page Configurer une base de données SQL Server source et sélectionnez votre type de base de données.

Modifier les tables

La méthode CDC des tables de modification permet aux utilisateurs de conserver les journaux plus rapidement, et permet ainsi d'économiser de l'espace de stockage, mais prend en charge un débit inférieur à celui obtenu avec la méthode des journaux de transactions. La méthode présente moins de limites que les journaux de transactions. Par exemple, elle élimine le risque de troncation des journaux entraînant une défaillance permanente des flux, et elle est compatible avec la réplication de tables chiffrées. Pour en savoir plus, consultez la section Limites connues.

Lorsque vous utilisez cette méthode CDC, les modifications apportées à la source sont suivies à l'aide de tables de modifications dédiées. Les journaux de transactions sont toujours utilisés, mais dans une certaine mesure, et vous n'avez pas besoin de les conserver plus longtemps. À mesure que les événements LMD sont appliqués aux tables sources, les modifications sont répliquées dans les tables de modifications correspondantes. Les tables des modifications ont la même structure que les tables sources, mais avec des colonnes supplémentaires pour inclure les métadonnées des modifications. Seules les transactions validées sont ajoutées aux tables de modifications, avec le numéro de séquence de journal (LSN) de l'opération de commit.

Versions

Datastream est compatible avec les versions et éditions suivantes des bases de données SQL Server:

  • Service autogéré (sur site ou dans le cloud) à l'aide des versions suivantes :
    • Entreprise: à partir de 2008
    • Standard: SP1 à partir de 2016
    • Développeur: à partir de 2008
  • Amazon RDS pour SQL Server
  • Base de données Azure SQL (niveau S3 et supérieur).

  • Cloud SQL pour SQL Server

Datastream n'est pas compatible avec les versions suivantes des bases de données SQL Server:

  • Édition SQL Server Standard de la version 2008 à 2014
  • SQL Server Express
  • SQL Server Web

Limitations connues

Voici quelques limitations connues concernant l'utilisation d'une base de données SQL Server en tant que source:

  • Les flux sont limités à 10 000 tables.
  • Une table comportant plus de 500 millions de lignes ne peut être remplie que si les conditions suivantes sont remplies :
    1. La table a un index unique.
    2. Aucune des colonnes d'index ne peut avoir une valeur nulle.
    3. Toutes les colonnes de l'index sont incluses dans le flux.
  • Les bases de données pour lesquelles la durabilité retardée ou la récupération accélérée de base de données (ADR) sont activées ne sont pas compatibles.
  • Il n'est pas possible de diffuser des modifications en streaming dans les tables système.
  • L'authentification Windows Active Directory (AD) n'est pas prise en charge.
  • Datastream n'est pas compatible avec la méthode de connectivité par tunnel SSH de transfert pour les sources SQL Server.
  • Les types de données suivants ne sont pas compatibles et ne sont pas répliqués dans la destination :
    • SQL_VARIANT
    • HIERARCHYID
    • GEOMETRY
    • GEOGRAPHY
  • Datastream réplique les types de données définis par l'utilisateur, mais c'est le type de données de base à partir duquel vous obtenez votre type défini par l'utilisateur et qui est stocké dans la destination. Par exemple, si vous définissez un type de données USERNAME basé sur le type de données VARCHAR(50), les données sont stockées dans la destination en tant que VARCHAR(50).
  • Datastream n'accepte pas la CDC pour les colonnes d'objets volumineuses (TEXT, NTEXT, XML, IMAGE) ni les colonnes de longueur variable maximale (VARCHAR(MAX), VARBINARY(MAX), NVARCHAR(MAX)) dans les tables sans index unique.

    Si les colonnes d'objets volumineuses ne sont pas incluses dans le flux, la CDC est compatible.

  • Datastream n'est pas compatible avec le masquage des données. Les données sont répliquées sans masquage.

  • Datastream ne permet pas de répliquer les modifications appliquées à la base de données à l'aide du package DACPAC (Data Tier Application Package).

  • Datastream ne réplique pas les modifications apportées à l'aide des instructions WRITETEXT ou UPDATETEXT.

  • Datastream n'accepte pas la réplication des colonnes calculées.

  • Datastream n'est pas compatible avec l'utilisation de clés de chiffrement gérées par le client (CMEK) pour les flux utilisant des sources SQL Server.

  • Datastream n'accepte pas les types de compression COLUMNSTORE ou COLUMNSTORE ARCHIVE.

  • La récupération de flux n'est pas compatible avec les sources SQL Server.

Limites supplémentaires lors de l'utilisation de la méthode des journaux de transactions

Si vous utilisez la méthode CDC pour les journaux de transactions, les limites supplémentaires suivantes s'appliquent:

  • Le chiffrement transparent des données (TDE, Transparent Data Encryption) n'est pas compatible.
  • Le chiffrement au niveau de la colonne n'est pas accepté. Les données de ces colonnes sont remplacées par des valeurs NULL.
  • Datastream n'est pas compatible avec l'instruction ROLLBACK TO SAVEPOINT. Ces événements de rollback sont ignorés et ne sont pas répliqués dans la destination.
  • Datastream n'est pas compatible avec la CDC pour les lignes de plus de 8 Ko dans les types de tables suivants :
    • Tables sans index unique
    • Tables ne contenant qu'un index unique hors cluster, avec une ou plusieurs colonnes de longueur variable (VARCHAR, VARBINARY, NVARCHAR)
  • Datastream n'est pas compatible avec la CDC pour les colonnes d'objets volumineuses (TEXT, NTEXT, XML, IMAGE) dans les types de tables suivants:

    • Tables sans index unique
    • Tables ne contenant qu'un index unique hors cluster, avec une ou plusieurs colonnes de longueur variable (VARCHAR, VARBINARY, NVARCHAR)

    Si les colonnes d'objets volumineuses ne sont pas incluses dans le flux, la CDC n'est compatible avec ces tables que si elles possèdent des index valides.