Transmitir datos de bases de datos MongoDB

Datastream admite la replicación de eventos de cambio de una fuente de MongoDB. MongoDB es una base de datos NoSQL de código abierto que usa documentos similares a JSON. Un documento puede tener otros documentos insertados. Los documentos se agrupan en colecciones y una base de datos de MongoDB almacena una o varias colecciones de documentos.

En lugar de almacenar datos en tablas de filas y columnas como las bases de datos SQL relacionales, cada registro de una base de datos MongoDB es un documento descrito en JSON binario (BSON), una representación binaria de los datos. Las aplicaciones pueden recuperar estos datos en formato JSON.

Esta página contiene información sobre lo siguiente:

  • Términos clave que debes conocer al replicar desde una base de datos de MongoDB
  • El comportamiento de Datastream al gestionar los datos que se extraen de una base de datos MongoDB de origen
  • Las versiones y ediciones de MongoDB que admite Datastream
  • Limitaciones conocidas al usar MongoDB como fuente

Términos clave

A continuación, se indican los términos clave que debes conocer al trabajar con fuentes de MongoDB:

  • Conexión SRV: una cadena de conexión con un nombre de host que corresponde a un registro de servicio (SRV) del servicio de nombres de dominio (DNS). La cadena tiene el siguiente formato:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    Para obtener más información, consulta la documentación de MongoDB.

  • Cadena de conexión estándar: el formato estándar del URI de conexión de MongoDB que se usa para conectarse a una implementación independiente de MongoDB autogestionada, a un conjunto de réplicas o a un clúster fragmentado. La cadena tiene el siguiente formato:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    Para obtener más información, consulta la documentación de MongoDB.

  • Conjunto de réplicas: un clúster de servidores MongoDB que implementa la replicación y la conmutación por error automática. Los conjuntos de réplicas proporcionan redundancia y alta disponibilidad, y son la base de todas las implementaciones de producción.

  • Clúster fragmentado: un clúster fragmentado de MongoDB consta de fragmentos, mongos y servidores de configuración. MongoDB fragmenta los datos a nivel de colección, distribuyendo los datos de la colección entre los fragmentos del clúster.

  • mongos: la interfaz entre las aplicaciones cliente y el clúster fragmentado. mongos actúa como un router de consultas y escribe operaciones en fragmentos.

  • Colección: MongoDB organiza los datos en una estructura jerárquica. Una implementación de MongoDB contiene una o varias bases de datos, y cada base de datos contiene una o varias colecciones. En cada colección, MongoDB almacena los datos como documentos que contienen pares de campo y valor. Las colecciones son análogas a las tablas de las bases de datos relacionales.

Comportamiento

La base de datos MongoDB de origen se basa en flujos de cambios para replicar los cambios en el destino. Los flujos de cambios te permiten acceder a datos en tiempo real y se admiten en conjuntos de réplicas y clústeres fragmentados.

  • Si se configura, se replicarán todos los datos históricos de los objetos incluidos.
  • Se replican todos los cambios, como las inserciones, las actualizaciones y las eliminaciones de los objetos especificados.

Versiones

Datastream admite versiones de MongoDB posteriores a la 5.0.

Limitaciones conocidas

Estas son algunas de las limitaciones conocidas al usar MongoDB como fuente:

  • Cuando usas la API Datastream, solo puedes especificar los campos que quieres excluir de tu flujo. No se admite la especificación de una lista de inclusión de campos.
  • No se admite la recuperación de la emisión.

Siguientes pasos