Nachdem Sie einen Replikationsjob bereitgestellt haben, können Sie ihn nicht mehr bearbeiten oder ihm Tabellen hinzufügen. Fügen Sie die Tabellen stattdessen einem neuen oder duplizierten Replikationsjob hinzu.
Option 1: Neuen Replikationsjob erstellen
Die einfachste Methode ist, Tabellen einem neuen Job hinzuzufügen. So wird verhindert, dass Verlaufsdaten für alle Tabellen neu geladen werden und Dateninkonsistenzen auftreten.
Nachteile sind der erhöhte Aufwand für die Verwaltung mehrerer Replikationsjobs und der höhere Verbrauch von Rechenressourcen, da jeder Job standardmäßig in einem separaten sitzungsspezifischen Dataproc-Cluster ausgeführt wird. Letzteres kann durch die Verwendung eines freigegebenen statischen Dataproc-Clusters für beide Jobs teilweise vermieden werden.
Weitere Informationen zum Erstellen neuer Jobs finden Sie in den Anleitungen zur Replikation.
Weitere Informationen zur Verwendung statischer Dataproc-Cluster in Cloud Data Fusion finden Sie unter Pipeline für einen vorhandenen Dataproc-Cluster ausführen.
Option 2: Aktuellen Replikationsjob anhalten und ein Duplikat erstellen
Wenn Sie den Replikationsjob duplizieren, um die Tabellen hinzuzufügen, beachten Sie Folgendes:
Wenn Sie den Snapshot für den Duplikatjob aktivieren, werden alle Tabellen neu aus dem Verlauf geladen. Dies wird empfohlen, wenn Sie die vorherige Option, bei der Sie separate Jobs ausführen, nicht verwenden können.
Wenn Sie den Snapshot deaktivieren, um die Datenlast zu verhindern, kann es zu Datenverlusten kommen, da zwischen dem Stopp der alten Pipeline und dem Start der neuen Pipeline Ereignisse verpasst werden können. Es wird nicht empfohlen, eine Überschneidung zu erstellen, um dieses Problem zu beheben, da dies auch zu Datenverlusten führen kann. Verlaufsdaten für die neuen Tabellen werden nicht repliziert.
So erstellen Sie einen Replikationsjob für eine Duplikatdatei:
Beenden Sie die vorhandene Pipeline.
Suchen Sie auf der Seite „Replikationsjobs“ nach dem Job, den Sie duplizieren möchten, klicken Sie auf
und dann auf Duplizieren.Snapshot aktivieren:
- Klicken Sie auf Quelle konfigurieren.
- Wählen Sie im Feld Vorhandene Daten replizieren die Option Ja aus.
Fügen Sie im Fenster Tabellen und Transformationen auswählen Tabellen hinzu und folgen Sie dem Assistenten, um die Replikationspipeline bereitzustellen.