Quell-MongoDB-Dokumentdatenbank

Datastream unterstützt die Replikation von Änderungsereignissen aus einer MongoDB-Quelle. MongoDB ist eine Open-Source-NoSQL-Datenbank, die JSON-ähnliche Dokumente verwendet. Ein Dokument kann andere Dokumente enthalten. Die Dokumente werden in Sammlungen zusammengefasst und in einer MongoDB-Datenbank werden eine oder mehrere Sammlungen von Dokumenten gespeichert.

Anstatt Daten wie in relationalen SQL-Datenbanken in Tabellen mit Zeilen und Spalten zu speichern, ist jeder Datensatz in einer MongoDB-Datenbank ein Dokument, das in binärem JSON (BSON) beschrieben wird, einer binären Darstellung von Daten. Anwendungen können diese Daten dann im JSON-Format abrufen.

Auf dieser Seite finden Sie Informationen zu folgenden Themen:

  • Die wichtigsten Begriffe, die Sie kennen müssen, wenn Sie Daten aus einer MongoDB-Datenbank replizieren
  • Der Umgang von Datastream mit Daten, die aus einer MongoDB-Quelldatenbank abgerufen werden
  • Die von Datastream unterstützten Versionen und Editionen von MongoDB
  • Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle

Wichtige Begriffe

Im Folgenden finden Sie die wichtigsten Begriffe, die Sie bei der Arbeit mit MongoDB-Quellen kennen sollten:

  • SRV-Verbindung: Ein Verbindungsstring mit einem Hostnamen, der einem DNS-SRV-Datensatz (Domain Name Service) entspricht. Der String hat folgendes Format:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    Weitere Informationen finden Sie in der MongoDB-Dokumentation.

  • Standardverbindungsstring: Das Standardformat des MongoDB-Verbindungs-URI, der verwendet wird, um eine Verbindung zu einer selbst gehosteten eigenständigen MongoDB-Bereitstellung, einem Replikatset oder einem fragmentierten Cluster herzustellen. Der String hat das folgende Format:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    Weitere Informationen finden Sie in der MongoDB-Dokumentation.

  • Replikatset: Ein Cluster von MongoDB-Servern, der Replikation und automatisches Failover implementiert. Replikatgruppen bieten Redundanz und Hochverfügbarkeit und bilden die Grundlage für alle Produktionsbereitstellungen.

  • Fragmentierter Cluster: Ein fragmentierter MongoDB-Cluster besteht aus Shards, mongos und Konfigurationsservern. In MongoDB werden Daten auf Sammlungsebene aufgeteilt und die Sammlungsdaten auf die Shards im Cluster verteilt.

  • mongos: die Schnittstelle zwischen den Clientanwendungen und dem Sharded Cluster. mongos fungiert als Abfrage-Router und schreibt Vorgänge in Shards.

  • Sammlung: In MongoDB werden Daten in einer hierarchischen Struktur organisiert. Eine MongoDB-Bereitstellung enthält eine oder mehrere Datenbanken und jede Datenbank enthält eine oder mehrere Sammlungen. In jeder Sammlung speichert MongoDB Daten als Dokumente, die Feld- und Wertpaare enthalten. Sammlungen sind analog zu Tabellen in relationalen Datenbanken.

Verhalten

Die MongoDB-Quelldatenbank verwendet Änderungsstreams, um Änderungen in das Ziel zu replizieren. Mit Änderungsstreams können Sie auf Echtzeitdaten zugreifen. Sie werden für Replikatsätze und Shard-Cluster unterstützt.

  • Falls konfiguriert, werden alle Verlaufsdaten für die eingeschlossenen Objekte repliziert.
  • Alle Änderungen wie Einfügungen, Aktualisierungen und Löschungen aus den angegebenen Objekten werden repliziert.

Versionen

Datastream unterstützt MongoDB-Versionen, die neuer als 5.0 sind.

Bekannte Einschränkungen

Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle:

  • Wenn Sie die Datastream API verwenden, können Sie nur angeben, welche Felder Sie aus Ihrem Stream ausschließen möchten. Die Angabe einer Einschlussliste für Felder wird nicht unterstützt.
  • Die Streamwiederherstellung wird nicht unterstützt.

Nächste Schritte