Prüfen Sie mindestens, ob die Datenbankinstanz und ihre Tabellen in der Cloud SQL-Instanz vorhanden sind. Sie können auch die Zeilenanzahl oder den genauen Inhalt der Tabellen prüfen.
Mit dem Datenvalidierungstool überprüfen
Verwenden Sie ein Open-Source-Datenvalidierungstool, um zu prüfen, ob die Daten in der Quelle und im Ziel übereinstimmen.
So validieren Sie ein Minimalbeispiel:
Stellen Sie eine virtuelle Maschine mit Zugriff auf die Quelle und das Ziel bereit oder verwenden Sie sie.
Erstellen Sie auf der virtuellen Maschine einen Ordner, in dem Sie das Data Validation Tool installieren.
Rufen Sie den von Ihnen erstellten Ordner auf.
Installieren Sie das Datenvalidierungstool mit pip:
pip install google-pso-data-validator
Erstellen Sie Verbindungen zur Oracle-Quelldatenbank und zur Cloud SQL for PostgreSQL-Zieldatenbank:
data-validation connections add -c source Oracle --host 'ip-address' --port port --user username --password pswd --database database-name data-validation connections add -c target Postgres --host 'ip-address' --port port --user username --password pswd --database database-name
Beispiel:
data-validation connections add -c source Oracle --host '10.10.10.11' --port 1521 --user system --password pswd --database XE data-validation connections add -c target Postgres --host '10.10.10.12' --port 5432 --user postgres --password pswd --database postgres
Erstellen oder generieren Sie eine Liste von Tabellen, um Daten zwischen der Quell- und der Zieldatenbank zu vergleichen:
export TABLES_LIST=$(data-validation find-tables --source-conn source --target-conn target --allowed-schemas schema-name)
Beispiel:
export TABLES_LIST=$(data-validation find-tables --source-conn source --target-conn target --allowed-schemas public)
Vollständige Validierung für alle Tabellen ausführen:
data-validation validate column --source-conn source --target-conn target --tables-list "${TABLES_LIST}"
Wir empfehlen, diese Validierung während der Replikation durchzuführen, um für relative Konsistenz zu sorgen. Bei einem kurzen Angebotszeitraum kann die Ausführung von Abfragen für große Tabellen zu lange dauern. Verwenden Sie in solchen Fällen das Tool zur Datenvalidierung, um Filter hinzuzufügen und die Laufzeit zu verkürzen, oder bereiten Sie die Tabellenliste so vor, dass sie für die abschließende Validierung nur eine Teilmenge der Tabellen enthält.