Nachdem Sie einen Replikationsjob bereitgestellt haben, können Sie Tabellen nicht mehr bearbeiten oder hinzufügen. . Fügen Sie die Tabellen stattdessen einem neuen oder doppelten Replikationsjob hinzu.
Option 1: Neuen Replikationsjob erstellen
Das Hinzufügen von Tabellen zu einem neuen Job ist die einfachste Methode. So wird verhindert, dass Verlaufsdaten für alle Tabellen neu geladen werden und Dateninkonsistenzen auftreten.
Nachteile sind der erhöhte Aufwand für die Verwaltung mehrerer Replikationsjobs und der höhere Verbrauch von Rechenressourcen, da jeder Job standardmäßig in einem separaten sitzungsspezifischen Dataproc-Cluster ausgeführt wird. Letzteres lässt sich bis zu einem gewissen Grad durch die Verwendung einer gemeinsam genutzten statischen Dataproc-Cluster für beide Jobs.
Weitere Informationen zum Erstellen neuer Jobs finden Sie in der Replikationsanleitungen
Weitere Informationen zur Verwendung statischer Dataproc-Cluster in Cloud Data Fusion finden Sie unter Pipeline für einen vorhandenen Dataproc-Cluster ausführen.
Option 2: Aktuellen Replikationsjob anhalten und Duplikat erstellen
Wenn Sie den Replikationsjob duplizieren, um die Tabellen hinzuzufügen, beachten Sie Folgendes:
Das Aktivieren des Snapshots für den duplizierten Job führt zum Verlauf der Last von alle Tabellen von Grund auf neu. Dies wird empfohlen, wenn Sie das bei der Sie separate Jobs ausführen.
Das Deaktivieren des Snapshots, um den bisherigen Ladevorgang zu verhindern, kann zu Daten führen da zwischen dem Beenden der alten Pipeline und dem beginnt die neue. Es wird nicht empfohlen, eine Überschneidung zu erstellen, um dieses Problem zu beheben, da dies auch zu Datenverlusten führen kann. Verlaufsdaten für die neuen Tabellen werden nicht repliziert.
So erstellen Sie einen duplizierten Replikationsjob:
Beenden Sie die vorhandene Pipeline.
Suchen Sie auf der Seite „Replikationsjobs“ nach dem Job, den Sie duplizieren möchten, klicken Sie auf
und dann auf Duplizieren.Aktivieren Sie den Snapshot:
- Gehen Sie zu Quelle konfigurieren.
- Wählen Sie im Feld Vorhandene Daten replizieren die Option Ja aus.
Fügen Sie im Fenster Tabellen und Transformationen auswählen Tabellen hinzu und folgen Sie dem Assistenten, um die Replikationspipeline bereitzustellen.