Nahtlose Replikation von relationalen Datenbanken direkt in BigQuery, wodurch Informationen nahezu in Echtzeit über operative Daten gewonnen werden.
Replikation mit niedriger Latenz, um echtzeitnahe Informationen in BigQuery zu ermöglichen
Zugriff auf Streamingdaten aus MySQL-, PostgreSQL-, AlloyDB-, SQL Server- und Oracle-Datenbanken
Serverlose Plattform, die automatisch skaliert wird, ohne dass Ressourcen bereitgestellt oder verwaltet werden müssen
Einfache Einrichtung von ELT-Pipelines (Extrahieren, Laden, Transformieren) mit integrierter sicherer Konnektivität
Von Tausenden Kunden verwendet, um Betriebsdaten in BigQuery zu replizieren
Vorteile
Replizieren Sie Daten aus MySQL-, PostgreSQL-, AlloyDB- und Oracle-Datenbanken direkt in BigQuery mit niedriger Latenz und ohne Auswirkungen auf die Quellleistung.
Beseitigen Sie den operativen Aufwand mit einem serverlosen Ansatz, der automatisch skaliert wird, ohne dass Sie eine Infrastruktur verwalten müssen.
Mit einer vereinfachten Einrichtung können Sie mit wenigen Schritten Daten aus Ihren operativen Datenbanken in BigQuery replizieren.
Wichtige Features
Datastream nutzt die Change Data Capture (CDC)-Funktion von BigQuery und die Storage Write API, um Aktualisierungen nahezu in Echtzeit direkt aus Quellsystemen zu replizieren. Sie benötigen keine Replikationslösungen mehr, die wertvolle Ressourcen für komplexe Datenpipelines, selbstverwaltete Staging-Tabellen, knifflige Zusammenführungslogik oder manuelle Datentypkonvertierung verschwenden.
Mit Datastream können Sie in wenigen Schritten Daten in BigQuery replizieren. Konfigurieren Sie dazu einfach die Quelldatenbank, den Verbindungstyp und das Ziel in BigQuery. Datastream für BigQuery fügt Verlaufsdaten per Backfill hinzu und repliziert kontinuierlich neue Änderungen.
Datastream liest und überträgt mit minimaler Latenz jede Änderung – eingefügt, aktualisiert oder gelöscht – aus Ihren MySQL-, PostgreSQL-, AlloyDB- und Oracle-Datenbanken. Die Quelldatenbank kann lokal in Google Cloud-Diensten wie Cloud SQL oder Bare-Metal-Lösung für Oracle oder an einem anderen Ort in einer Cloud gehostet werden. Ein Dienst ohne Agent und Google-eigener Dienst, der speziell für BigQuery entwickelt wurde, streamt jedes Ereignis zuverlässig.
Wenn sich das Quellschema ändert, verarbeitet Datastream Schemaabweichungen und repliziert automatisch neue Spalten und Tabellen, die der Quelle in BigQuery hinzugefügt wurden.
Datastream unterstützt mehrere sichere, private Verbindungsmethoden zum Schutz von Daten bei der Übertragung. Außerdem werden ruhende Daten verschlüsselt.
Kunden
Anwendungsfälle
Datastream liest Änderungsereignisse (Einfügen, Aktualisieren und Löschen) aus Quelldatenbanken und schreibt sie nahezu in Echtzeit in BigQuery-Tabellen. Dadurch können Sie vorhandene BigQuery-Data-Warehouses und ML-Modelle mit Transaktionsdaten wie Einzelhandelsgeschäften anreichern, um ein umfassenderes End-to-End-Bild von Daten zu erhalten. Datastream fügt Verlaufsdaten per Backfill hinzu, repliziert neue Änderungen kontinuierlich und verarbeitet Schemaänderungen nahtlos.
Hauptvorteile
Einfachste Option zum Replizieren von Betriebsdaten in BigQuery
Serverlose Architektur, die automatisch hoch- und herunterskaliert
Einzelne Schnittstelle für End-to-End-Sichtbarkeit und Monitoring von Replikationspipelines
Anpassbare Lösung mit zusätzlicher Flexibilität
Vorgefertigte Vorlagen, die von Google für eine Reihe von Zielen unterstützt werden
Einbindung zusätzlicher Features wie Datenqualität und Datenmaskierung
Einfache Oberfläche für ETL-Entwickler und Datenanalysten
Mögliche Probleme und Replikationslücken im Voraus erkennen
Nahezu Echtzeitinformationen zur Replikationsleistung
Hauptvorteile
Einfachste Option zum Replizieren von Betriebsdaten in BigQuery
Serverlose Architektur, die automatisch hoch- und herunterskaliert
Einzelne Schnittstelle für End-to-End-Sichtbarkeit und Monitoring von Replikationspipelines
Hauptvorteile
Anpassbare Lösung mit zusätzlicher Flexibilität
Vorgefertigte Vorlagen, die von Google für eine Reihe von Zielen unterstützt werden
Einbindung zusätzlicher Features wie Datenqualität und Datenmaskierung
Hauptvorteile
Einfache Oberfläche für ETL-Entwickler und Datenanalysten
Mögliche Probleme und Replikationslücken im Voraus erkennen
Nahezu Echtzeitinformationen zur Replikationsleistung
Preise
Die Preise für Datastream basieren auf den tatsächlich verarbeiteten Daten. Es sind volumenbasierte Preisstufen verfügbar, die es erschwinglicher machen, wenn Sie größere Datenmengen verschieben. Weitere Preisdetails finden Sie auf der Seite „Datastream-Preise“.
Zusätzliche Ressourcen wie BigQuery, Cloud Storage und Dataflow werden nach den Preisen für diese Dienste abgerechnet.
Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.