Base de données de documents MongoDB source

Datastream permet de répliquer les événements de modification à partir d'une source MongoDB. MongoDB est une base de données NoSQL Open Source qui utilise des documents de type JSON. Un document peut contenir d'autres documents intégrés. Les documents sont regroupés dans des collections, et une base de données MongoDB stocke une ou plusieurs collections de documents.

Au lieu de stocker les données dans des tables de lignes et de colonnes comme les bases de données SQL relationnelles, chaque enregistrement d'une base de données MongoDB est un document décrit en JSON binaire (BSON), une représentation binaire des données. Les applications peuvent ensuite récupérer ces données au format JSON.

Cette page contient des informations sur les éléments suivants :

  • Termes clés à comprendre lorsque vous répliquez des données à partir d'une base de données MongoDB
  • Comportement de Datastream lors de la gestion des données extraites d'une base de données MongoDB source
  • Versions et éditions de MongoDB compatibles avec Datastream
  • Limites connues de l'utilisation de MongoDB comme source

Termes clés

Voici les termes clés à connaître lorsque vous travaillez avec des sources MongoDB :

  • Connexion SRV : chaîne de connexion avec un nom d'hôte qui correspond à un enregistrement de service (SRV) du service de nom de domaine (DNS). La chaîne a le format suivant :

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    Pour en savoir plus, consultez la documentation MongoDB.

  • Chaîne de connexion standard : format standard de l'URI de connexion MongoDB utilisé pour se connecter à un déploiement MongoDB autonome, un ensemble d'instances répliquées ou un cluster segmenté autohébergés. La chaîne a le format suivant :

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    Pour en savoir plus, consultez la documentation MongoDB.

  • Ensemble d'instances répliquées : cluster de serveurs MongoDB qui implémente la réplication et le basculement automatique. Les ensembles de répliquas offrent redondance et haute disponibilité, et constituent la base de tous les déploiements de production.

  • Cluster segmenté : un cluster segmenté MongoDB se compose de shards, de mongos et de serveurs de configuration. MongoDB fragmente les données au niveau de la collection, en les distribuant dans les fragments du cluster.

  • mongos : interface entre les applications clientes et le cluster partitionné. mongos agit comme un routeur de requêtes et écrit les opérations dans les partitions.

  • Collection : MongoDB organise les données selon une structure hiérarchique. Un déploiement MongoDB contient une ou plusieurs bases de données, et chaque base de données contient une ou plusieurs collections. Dans chaque collection, MongoDB stocke les données sous forme de documents contenant des paires champ/valeur. Les collections sont analogues aux tables dans les bases de données relationnelles.

Comportement

La base de données MongoDB source s'appuie sur des flux de modifications pour répliquer les modifications vers la destination. Les flux de modifications vous permettent d'accéder aux données en temps réel. Ils sont compatibles avec les ensembles de répliquas et les clusters fragmentés.

  • Si elle est configurée, toutes les données historiques sont répliquées pour les objets inclus.
  • Toutes les modifications, telles que les insertions, les mises à jour et les suppressions des objets spécifiés, sont répliquées.

Versions

Datastream est compatible avec les versions de MongoDB ultérieures à la version 5.0.

Limitations connues

Les limites connues d'utilisation de MongoDB en tant que source incluent les suivantes :

  • Lorsque vous utilisez l'API Datastream, vous ne pouvez spécifier que les champs que vous souhaitez exclure de votre flux. Il n'est pas possible de spécifier une liste d'inclusion pour les champs.
  • La récupération du flux n'est pas prise en charge.

Étapes suivantes