Database di documenti MongoDB di origine

Datastream supporta la replica degli eventi di modifica da un'origine MongoDB. MongoDB è un database NoSQL open source che utilizza documenti di tipo JSON. Un documento può contenere altri documenti incorporati. I documenti vengono raggruppati in raccolte e un database MongoDB archivia una o più raccolte di documenti.

Anziché archiviare i dati in tabelle di righe e colonne come i database SQL relazionali, ogni record in un database MongoDB è un documento descritto in JSON binario (BSON), una rappresentazione binaria dei dati. Le applicazioni possono quindi recuperare questi dati in formato JSON.

Questa pagina contiene informazioni su:

  • I termini chiave che devi comprendere quando esegui la replica da un database MongoDB
  • Il comportamento di Datastream nella gestione dei dati estratti da un database MongoDB di origine
  • Versioni ed edizioni di MongoDB supportate da Datastream
  • Limitazioni note per l'utilizzo di MongoDB come origine

Termini chiave

Di seguito sono riportati i termini chiave che devi comprendere quando lavori con le origini MongoDB:

  • Connessione SRV: una stringa di connessione con un nome host che corrisponde a un record di servizio (SRV) del servizio di nomi di dominio (DNS). La stringa ha il seguente formato:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    Per saperne di più, consulta la documentazione di MongoDB.

  • Stringa di connessione standard: il formato standard dell'URI di connessione MongoDB utilizzato per connettersi a un deployment autonomo, a un set di repliche o a un cluster con sharding MongoDB self-hosted. La stringa ha il seguente formato:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    Per saperne di più, consulta la documentazione di MongoDB.

  • Set di repliche: un cluster di server MongoDB che implementa la replica e il failover automatico. I set di repliche forniscono ridondanza e alta disponibilità e sono la base per tutti i deployment di produzione.

  • Cluster con sharding: un cluster con sharding MongoDB è costituito da shard, mongos e server di configurazione. MongoDB esegue lo sharding dei dati a livello di raccolta, distribuendo i dati della raccolta tra gli shard del cluster.

  • mongos: l'interfaccia tra le applicazioni client e il cluster con partizionamento. mongos funge da router di query e scrive operazioni negli shard.

  • Raccolta: MongoDB organizza i dati in una struttura gerarchica. Un deployment MongoDB contiene uno o più database e ogni database contiene una o più raccolte. In ogni raccolta, MongoDB archivia i dati come documenti che contengono coppie campo-valore. Le raccolte sono analoghe alle tabelle dei database relazionali.

Comportamento

Il database MongoDB di origine si basa sui modifiche in tempo reale per replicare le modifiche nella destinazione. Le modifiche in tempo reale consentono di accedere ai dati in tempo reale e sono supportate per i set di repliche e i cluster partizionati.

  • Se configurati, tutti i dati storici vengono replicati per gli oggetti inclusi.
  • Vengono replicate tutte le modifiche, come inserimenti, aggiornamenti ed eliminazioni dagli oggetti specificati.

Versioni

Datastream supporta le versioni di MongoDB successive alla 5.0.

Limitazioni note

Le limitazioni note per l'utilizzo di MongoDB come origine includono:

  • Quando utilizzi l'API Datastream, puoi specificare solo i campi che vuoi escludere dal flusso. La specifica di un elenco di inclusione per i campi non è supportata.
  • Il recupero dello stream non è supportato.

Passaggi successivi