Configure uma base de dados MongoDB para CDC

Esta página descreve como configurar a captura de dados de alterações (CDC) para transmitir dados de uma base de dados MongoDB para um destino suportado, como o BigQuery ou o Cloud Storage. Pode configurar o Datastream para replicar dados de um serviço de base de dados na nuvem totalmente gerido denominado Atlas ou, se estiver a replicar a partir de uma instância do MongoDB autogerida, através do shell do MongoDB.

Configure uma instância do MongoDB Atlas

Para usar o Datastream com uma instância do MongoDB Atlas, primeiro tem de criar um utilizador do Datastream e conceder-lhe acesso à base de dados:

  1. No painel de controlo do MongoDB Atlas, em Segurança, clique em Acesso à base de dados.
  2. Clique em Novo utilizador da base de dados e selecione o método de autenticação por palavra-passe para o utilizador.
  3. Introduza o nome de utilizador e a palavra-passe do utilizador do fluxo de dados.
  4. Selecione Conceder privilégios de utilizador específicos em Privilégios do utilizador da base de dados.
  5. Adicione estas funções/privilégios em Privilégios específicos:
    • readAnyDatabase
  6. Clique em Adicionar utilizador.

Configure uma instância autoalojada do MongoDB

Esta página descreve como configurar uma base de dados autoalojada do MongoDB para utilização com o Datastream para o conjunto de réplicas e o cluster fragmentado.

Conjunto de réplicas

Para ver informações sobre a implementação de um conjunto de réplicas do MongoDB, consulte o artigo Implemente um conjunto de réplicas autogerido na documentação do MongoDB.

Para configurar a stream de dados para utilização com um conjunto de réplicas do MongoDB autogerido, siga estes passos:

  1. Instale o MongoDB Shell. Para ver informações sobre a instalação do MongoDB Shell, consulte a documentação do MongoDB.
  2. Abra o terminal e execute o comando mongosh para estabelecer ligação ao conjunto de réplicas ou ao nó principal.
  3. Crie um utilizador para a stream de dados na base de dados admin:
   use admin
   db.createUser({
     user: "USERNAME",
     pwd: "PASSWORD",
     roles: [ "readAnyDatabase", {role: "read", db: "admin"} ]
   })

Substitua USERNAME e PASSWORD pelo seu nome de utilizador e palavra-passe.

Cluster fragmentado

Para obter informações sobre a implementação de um cluster fragmentado, consulte o artigo Implemente um cluster fragmentado na documentação do MongoDB.

Para configurar o Datastream para utilização com um cluster fragmentado do MongoDB autogerido, siga estes passos:

  1. Instale o MongoDB Shell. Para ver informações sobre a instalação do MongoDB Shell, consulte a documentação do MongoDB.
  2. Abra o terminal e execute o comando mongosh para estabelecer ligação ao cluster fragmentado do MongoDB.
  3. Crie um utilizador de stream de dados idêntico em todos os nós de fragmentação primários e no router de consultas mongos:
use admin
db.createUser({
   user: "USERNAME",
   pwd: "PASSWORD",
   roles: [ "readAnyDatabase" ]
})

Substitua USERNAME e PASSWORD pelo seu nome de utilizador e palavra-passe. Pode escolher qualquer nome de utilizador e palavra-passe, mas tem de ser consistente em todos os nós de fragmentação principais e no router de consultas do mongos.

Para saber que fragmentos estão ligados ao router de consultas mongos, execute o seguinte comando:

db.adminCommand({ listShards: 1 })