Datastream unterstützt die Replikation von Änderungsereignissen aus einer MongoDB-Quelle. MongoDB ist eine Open-Source-NoSQL-Datenbank, die JSON-ähnliche Dokumente verwendet. Ein Dokument kann andere Dokumente enthalten. Die Dokumente werden in Sammlungen zusammengefasst und in einer MongoDB-Datenbank werden eine oder mehrere Sammlungen von Dokumenten gespeichert.
Anstatt Daten wie in relationalen SQL-Datenbanken in Tabellen mit Zeilen und Spalten zu speichern, ist jeder Datensatz in einer MongoDB-Datenbank ein Dokument, das in binärem JSON (BSON) beschrieben wird, einer binären Darstellung von Daten. Anwendungen können diese Daten dann im JSON-Format abrufen.
Auf dieser Seite finden Sie Informationen zu folgenden Themen:
- Die wichtigsten Begriffe, die Sie kennen müssen, wenn Sie Daten aus einer MongoDB-Datenbank replizieren
- Der Umgang von Datastream mit Daten, die aus einer MongoDB-Quelldatenbank abgerufen werden
- Die von Datastream unterstützten Versionen und Editionen von MongoDB
- Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle
Wichtige Begriffe
Im Folgenden finden Sie die wichtigsten Begriffe, die Sie bei der Arbeit mit MongoDB-Quellen kennen sollten:
SRV-Verbindung: Ein Verbindungsstring mit einem Hostnamen, der einem DNS-SRV-Datensatz (Domain Name Service) entspricht. Der String hat folgendes Format:
mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]
Weitere Informationen finden Sie in der MongoDB-Dokumentation.
Standardverbindungsstring: Das Standardformat des MongoDB-Verbindungs-URI, der verwendet wird, um eine Verbindung zu einer selbst gehosteten eigenständigen MongoDB-Bereitstellung, einem Replikatset oder einem fragmentierten Cluster herzustellen. Der String hat das folgende Format:
mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]
Weitere Informationen finden Sie in der MongoDB-Dokumentation.
Replikatset: Ein Cluster von MongoDB-Servern, der Replikation und automatisches Failover implementiert. Replikatgruppen bieten Redundanz und Hochverfügbarkeit und bilden die Grundlage für alle Produktionsbereitstellungen.
Fragmentierter Cluster: Ein fragmentierter MongoDB-Cluster besteht aus Shards, mongos und Konfigurationsservern. In MongoDB werden Daten auf Sammlungsebene aufgeteilt und die Sammlungsdaten auf die Shards im Cluster verteilt.
mongos: die Schnittstelle zwischen den Clientanwendungen und dem Sharded Cluster.
mongos
fungiert als Abfrage-Router und schreibt Vorgänge in Shards.Sammlung: In MongoDB werden Daten in einer hierarchischen Struktur organisiert. Eine MongoDB-Bereitstellung enthält eine oder mehrere Datenbanken und jede Datenbank enthält eine oder mehrere Sammlungen. In jeder Sammlung speichert MongoDB Daten als Dokumente, die Feld- und Wertpaare enthalten. Sammlungen sind analog zu Tabellen in relationalen Datenbanken.
Verhalten
Die MongoDB-Quelldatenbank verwendet Änderungsstreams, um Änderungen in das Ziel zu replizieren. Mit Änderungsstreams können Sie auf Echtzeitdaten zugreifen. Sie werden für Replikatsätze und Shard-Cluster unterstützt.
- Falls konfiguriert, werden alle Verlaufsdaten für die eingeschlossenen Objekte repliziert.
- Alle Änderungen wie Einfügungen, Aktualisierungen und Löschungen aus den angegebenen Objekten werden repliziert.
Versionen
Datastream unterstützt MongoDB-Versionen, die neuer als 5.0 sind.
Bekannte Einschränkungen
Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle:
- Wenn Sie die Datastream API verwenden, können Sie nur angeben, welche Felder Sie aus Ihrem Stream ausschließen möchten. Die Angabe einer Einschlussliste für Felder wird nicht unterstützt.
- Die Streamwiederherstellung wird nicht unterstützt.
Nächste Schritte
- Informationen zum Konfigurieren einer MongoDB-Quelle zur Verwendung mit Datastream