Tabelle für aktivierte Änderungsstreams erstellen und Änderungen erfassen
Hier erfahren Sie, wie Sie eine Cloud Bigtable-Tabelle mit aktiviertem Änderungsstream einrichten, eine Änderungsstream-Pipeline ausführen, Änderungen an der Tabelle vornehmen und sich dann die gestreamten Änderungen ansehen.
Hinweise
-
Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Dataflow and Cloud Bigtable APIs aktivieren.
-
Aktivieren Sie Cloud Shell in der Google Cloud Console.
Tabelle mit aktiviertem Änderungsstream erstellen
Rufen Sie in der Google Cloud Console die Bigtable-Seite Instanzen auf.
Klicken Sie auf die ID der Instanz, die Sie für diese Kurzanleitung verwenden.
Wenn Sie keine Instanz haben, erstellen Sie eine Instanz mit den Standardkonfigurationen in einer Region in Ihrer Nähe.
Klicken Sie im linken Navigationsbereich auf Sicherungen.
Klicken Sie auf Tabelle erstellen.
Benennen Sie die Tabelle
change-streams-quickstart
.Fügen Sie eine Spaltenfamilie mit dem Namen
cf
hinzu.Wählen Sie Änderungsstream aktivieren aus.
Klicken Sie auf Erstellen.
Initialisieren Sie eine Datenpipeline, um den Änderungsstream zu erfassen
Führen Sie in Cloud Shell die folgenden Befehle aus, um den Code herunterzuladen und auszuführen.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
Ersetzen Sie Folgendes:
- PROJECT_ID: die ID des verwendeten Projekts
- BIGTABLE_INSTANCE_ID: die ID der Instanz, die die neue Tabelle enthalten soll
- BIGTABLE_REGION: die Region, in der sich Ihre Bigtable-Instanz befindet, z. B.
us-east5
Rufen Sie in der Google Cloud Console die Seite Dataflow auf.
Klicken Sie auf den Job mit einem Namen, der mit changestreamquickstart beginnt.
Klicken Sie unten auf dem Bildschirm auf Anzeigen, um den Logbereich zu öffnen.
Klicken Sie auf Worker-Logs, um die Ausgabe des Änderungsstreams zu überwachen.
Schreiben Sie in Cloud Shell einige Daten in Bigtable, um den Prozess des Änderungsstreams zu sehen.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
In der Google Cloud Console muss der Schweregrad auf mindestens
Info
festgelegt sein.Die Ausgabelogs des Worker-Logs enthalten Folgendes:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
Bereinigen
So vermeiden Sie, dass Ihrem Google Cloud-Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
Änderungsstream für die Tabelle deaktivieren
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Löschen Sie die Tabelle
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
Beenden Sie die Änderungsstream-Pipeline:
Rufen Sie in der Google Cloud Console die Dataflow-Seite Jobs auf.
Wählen Sie den Streaming-Job aus der Jobliste aus.
Klicken Sie im Navigationsbereich auf Beenden.
Brechen Sie die Pipeline im Dialogfeld Job anhalten ab und klicken Sie dann auf Job stoppen.
Optional: Löschen Sie die Instanz, wenn Sie eine neue für diese Kurzanleitung erstellt haben:
cbt deleteinstance BIGTABLE_INSTANCE_ID