En esta página se describe cómo configurar la captura de datos de cambios (CDC) para transmitir datos desde una base de datos MongoDB a un destino compatible, como BigQuery o Cloud Storage. Puede configurar Datastream para replicar datos de un servicio de base de datos en la nube totalmente gestionado llamado Atlas o, si está replicando datos de una instancia de MongoDB autogestionada, mediante MongoDB Shell.
Configurar una instancia de MongoDB Atlas
Para usar Datastream con una instancia de MongoDB Atlas, primero debe crear un usuario de Datastream y concederle acceso a la base de datos:
- En el panel de control de MongoDB Atlas, vaya a Seguridad y haga clic en Acceso a la base de datos.
- Haz clic en Nuevo usuario de la base de datos y selecciona el método de autenticación con contraseña para tu usuario.
- Escribe el nombre de usuario y la contraseña del usuario de flujo de datos.
- Selecciona Conceder privilegios de usuario específicos en Privilegios de usuario de la base de datos.
- Añade estos roles o privilegios en Privilegios específicos:
readAnyDatabase
- Haz clic en Añadir usuario.
Configurar una instancia autohospedada de MongoDB
En esta página se describe cómo configurar una base de datos autohospedada de MongoDB para usarla con Datastream en un conjunto de réplicas y en un clúster fragmentado.
Conjunto de réplicas
Para obtener información sobre cómo desplegar un conjunto de réplicas de MongoDB, consulta el artículo Deploy a self-managed replica set (Desplegar un conjunto de réplicas autogestionado) de la documentación de MongoDB.
Para configurar Datastream de forma que se pueda usar con un conjunto de réplicas de MongoDB autogestionado, sigue estos pasos:
- Instala el shell de MongoDB. Para obtener información sobre cómo instalar MongoDB Shell, consulta la documentación de MongoDB.
- Abre el terminal y ejecuta el comando
mongosh
para conectarte a tu conjunto de réplicas o nodo principal. - Crea un usuario para Datastream en la base de datos
admin
:
use admin
db.createUser({
user: "USERNAME",
pwd: "PASSWORD",
roles: [ "readAnyDatabase", {role: "read", db: "admin"} ]
})
Sustituye USERNAME y PASSWORD por tu nombre de usuario y tu contraseña.
Clúster fragmentado
Para obtener información sobre cómo implementar un clúster fragmentado, consulta el artículo Implementar un clúster fragmentado de la documentación de MongoDB.
Para configurar Datastream para usarlo con un clúster fragmentado de MongoDB autogestionado, sigue estos pasos:
- Instala el shell de MongoDB. Para obtener información sobre cómo instalar MongoDB Shell, consulta la documentación de MongoDB.
- Abre la terminal y ejecuta el comando
mongosh
para conectarte a tu clúster fragmentado de MongoDB. - Crea un usuario de Datastream idéntico en cada nodo de fragmento principal y en el router de consultas
mongos
:
use admin
db.createUser({
user: "USERNAME",
pwd: "PASSWORD",
roles: [ "readAnyDatabase" ]
})
Sustituye USERNAME y PASSWORD por tu nombre de usuario y tu contraseña. Puedes elegir cualquier nombre de usuario y contraseña, pero deben ser los mismos en todos los nodos de fragmento primarios y en el enrutador de consultas mongos.
Para saber qué fragmentos están conectados al router de consultas mongos, ejecuta el siguiente comando:
db.adminCommand({ listShards: 1 })