Ressourcen für die Migration konfigurieren

Auf dieser Seite wird der Vorbereitungsteil des Migrationsprozesses beschrieben, in dem Sie Ressourcen für die Migration konfigurieren.

In dieser Phase gehen Sie so vor:

  1. Installieren Sie die Befehlszeilentools, die zum Ausführen von Befehlen in späteren Phasen des Migrationsprozesses erforderlich sind.
  2. Konfigurieren Sie eine Firestore-Datenbank mit MongoDB-Kompatibilität.
  3. Optional: Passen Sie die Einstellungen für das Operationslog (oplog) in Ihrer MongoDB-kompatiblen Quelle an.
  4. Erstellen Sie einen Cloud Storage-Bucket zum Speichern von Zwischendaten.

IAM-Berechtigungen konfigurieren

Ihr Konto benötigt die entsprechenden IAM-Rollen in allen Diensten, die im Migrationsprozess verwendet werden:

Befehlszeilentools installieren

Beim Migrationsverfahren wird die gcloud CLI verwendet, um die Migrationsschritte zu konfigurieren und auszuführen. Installieren Sie bei Bedarf die gcloud CLI, indem Sie der Anleitung auf der Seite gcloud CLI installieren folgen.

Quellspezifische Konfiguration

MongoDB auf Compute Engine

Eine MongoDB-Datenbank, die auf Compute Engine-VMs in einem selbstverwalteten Cluster ausgeführt wird, ist normalerweise nicht für das öffentliche Internet zugänglich. Beim Migrationsverfahren wird Private Service Connect in Datastream verwendet, um die Datastream-Pipeline mit Ihrer Quelldatenbank zu verbinden.

Gehen Sie dazu so vor:

  1. Konfigurieren Sie Datastream Private Connectivity gemäß der Anleitung unter Konfiguration für private Verbindungen erstellen.

  2. Notieren Sie den Configuration ID-Parameter der erstellten Konfiguration. Sie verwenden sie später, um die erforderlichen Umgebungsvariablen einzurichten.

Azure Cosmos DB

Die Azure-Befehlszeile muss auf Ihrem Computer installiert sein.

Amazon DocumentDB

Auf Amazon DocumentDB-Cluster kann nicht direkt von außerhalb des Amazon VPC-Netzwerk zugegriffen werden. Wenn Sie eine Verbindung zu einem DocumentDB-Cluster herstellen möchten, müssen Sie eine EC2-Instanz im Amazon VPC-Netzwerk bereitstellen und diese Instanz als Bastion Host für einen SSH-Tunnel verwenden.

Eine Anleitung zum Einrichten einer EC2-Instanz für die externe Verbindung zu DocumentDB finden Sie im Entwicklerleitfaden Connecting to an Amazon DocumentDB cluster from outside an Amazon VPC.

Um eine Verbindung zum DocumentDB-Cluster herzustellen, müssen Sie den privaten SSH-Schlüssel für die EC2-Instanz sowie das entsprechende Zertifikatbündel für die Region abrufen, in der Ihr Cluster bereitgestellt wird. Rufen Sie die Ressourcenseite Certificate bundles by AWS Region (Zertifikatspakete nach AWS-Region) auf, um das entsprechende Paket im PEM-Format herunterzuladen.

Das Zertifikatsbündel enthält mehrere Zertifikate. Sie müssen ein einzelnes Zertifikat extrahieren, um eine Datastream-Verbindung einzurichten. Es wird empfohlen, die DocumentDB-Verbindung manuell zu validieren, um sicherzustellen, dass Sie sowohl einen gültigen SSH-Schlüssel als auch ein gültiges DocumentDB-Zertifikat aus dem regionalen Bundle haben. In der DocumentDB-Entwicklerdokumentation finden Sie Befehlszeilenbeispiele für das Herstellen einer direkten Verbindung von außerhalb der VPC.

Firestore-Datenbank mit MongoDB-Kompatibilität als Ziel konfigurieren

  1. Ihr Projekt muss eine Firestore-Datenbank mit MongoDB-Kompatibilität haben, in die Sie Daten aus Ihrer MongoDB-Quelldatenbank migrieren. Weitere Informationen zum Erstellen einer Datenbank finden Sie unter Datenbanken erstellen und verwalten.

  2. Für diese Migration empfehlen wir, einen Nutzernamen und ein Passwort für die Firestore-Datenbank mit MongoDB-Kompatibilität zu erstellen, die mit dem SCRAM-SHA-256-Authentifizierungsprotokoll verwendet werden sollen. Dieser Nutzername kann nach Abschluss der Migration gefahrlos gelöscht werden. Sie können diese Anmeldedaten aber auch weiterhin verwenden, um Ihre Mongo-Clients mit Ihrer neuen Firestore-Datenbank mit MongoDB-Kompatibilität zu verbinden.

Sie benötigen den Namen dieser Firestore-Datenbank mit MongoDB-Kompatibilität und die Nutzeranmeldedaten in späteren Schritten.

Größe des Oplog-Fensters der Quelldatenbank anpassen

Wir empfehlen, das Oplog-Fenster Ihrer Quell-MongoDB auf drei Tage des gesamten Schreibzugriffs auf diese Datenbank einzustellen. Wenn die Rate des Schreibzugriffs die Rate übersteigt, mit der Datastream Änderungen aus Ihrer Datenbank verarbeiten kann, wird durch diese Anpassung ein Datenverlust verhindert.

Der Wert muss möglicherweise noch weiter angepasst werden, je nach Trafficmuster und Volumen des Spitzen-Traffics. Wenn beispielsweise der Traffic einer Woche in kurzer Zeit geschrieben wird, erfasst Datastream die Änderungen möglicherweise nicht schnell genug aus dem Oplog, bevor sie aus dem Oplog-Fenster fallen. In diesem Fall müssen Sie möglicherweise die Größe des Oplog-Fensters auf 7 Tage des gesamten Schreibverkehrs anpassen.

Cloud Storage-Bucket erstellen

So erstellen Sie einen neuen Cloud Storage-Bucket:

  1. Wählen Sie eine Cloud Storage-Region aus, in der die Migrationspipeline ausgeführt werden soll. Wir empfehlen, die Region zu verwenden, in der sich Ihre Firestore-Datenbank mit MongoDB-Kompatibilität befindet.

  2. Wählen Sie einen Namen für diesen Bucket aus. Beispiel: mongo-migration-bucket. Sie benötigen diesen Namen in späteren Schritten.

  3. Erstellen Sie einen neuen Cloud Storage-Bucket mit dem ausgewählten Namen und in der ausgewählten Region. Folgen Sie dazu der Anleitung auf der Seite Bucket erstellen in der Cloud Storage-Dokumentation.

Nächste Schritte

Fahren Sie mit Umgebungsvariablen konfigurieren fort.