Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Datastream è un servizio Change Data Capture (CDC) e di replica serverless e facile da usare che consente di sincronizzare i dati in modo affidabile e con latenza minima.
Datastream fornisce la replica perfetta dei dati da database operativi in BigQuery. Inoltre, Datastream supporta la scrittura del flusso di eventi di modifica in Cloud Storage e offre un'integrazione semplificata con i modelli Dataflow per creare flussi di lavoro personalizzati per il caricamento dei dati in un'ampia gamma di destinazioni, come Cloud SQL e Spanner. Puoi anche utilizzare Datastream per sfruttare il flusso di eventi direttamente da Cloud Storage, così da creare architetture basate su eventi. Datastream supporta le origini Oracle, MySQL, SQL Server, PostgreSQL (incluso AlloyDB per PostgreSQL), MongoDB (anteprima) e Salesforce (anteprima).
I vantaggi di Datastream includono:
Configurazione immediata delle pipeline ELT (Extract, Load, Transform) per la replica dei dati a bassa latenza per consentire insight quasi in tempo reale in BigQuery.
Essendo serverless, non ci sono risorse di cui eseguire il provisioning o da gestire e il servizio esegue lo scale up e lo scale down automaticamente, in base alle esigenze, con tempi di inattività minimi.
Esperienze di configurazione e monitoraggio facili da usare che consentono di ottenere un time-to-value super rapido.
Integrazione nel portafoglio dei migliori servizi di dati per l'integrazione dei dati in Datastream, Dataflow, Pub/Sub, BigQuery e altri. Google Cloud
Sincronizzazione e unificazione degli stream di dati in database e applicazioni eterogenei.
Sicurezza, con opzioni di connettività privata e la sicurezza che ti aspetti da
Google Cloud.
Essere preciso e affidabile, con report sullo stato trasparenti e ampia flessibilità di elaborazione di fronte ai cambiamenti di dati e schemi.
Supporta più casi d'uso, tra cui analisi, replica e sincronizzazione dei database per migrazioni e configurazioni cloud ibride e per la creazione di architetture basate su eventi.
Casi d'uso
Le funzionalità di streaming di Datastream consentono una serie di casi d'uso:
Replica e sincronizzazione dei dati in tutta l'organizzazione con latenza minima
Puoi sincronizzare i dati in diversi database e applicazioni in modo affidabile, a bassa latenza e con un impatto minimo sulle prestazioni dell'origine. Sfrutta la potenza degli stream di dati per l'analisi, la replica dei database, la migrazione al cloud e le architetture basate su eventi in ambienti ibridi.
Fai lo scale up o lo scale down con un'architettura serverless senza problemi
Raggiungi la piena operatività in modo rapido con un servizio serverless e facile da utilizzare che si adatta perfettamente alle variazioni dei volumi di dati. Concentrati sull'ottenimento di insight aggiornati dai tuoi dati e sulla risposta ai problemi di alta priorità, anziché sulla gestione dell'infrastruttura, sull'ottimizzazione delle prestazioni o sul provisioning delle risorse.
Eseguire l'integrazione con la suite di integrazione dei dati Google Cloud
Connetti i dati di tutta la tua organizzazione con la suite di prodotti di integrazione dei dati. Google Cloud Integra Datastream con i modelli di job Dataflow per leggere i dati da un bucket Cloud Storage e caricarli in una serie di destinazioni, come BigQuery, Spanner e Cloud SQL.
Elementi dell'esperienza
Datastream è composto da tre elementi principali:
Le configurazioni di connettività privata consentono a Datastream di comunicare con un'origine dati su una rete privata (internamente aGoogle Cloudo con origini esterne connesse tramite VPN o Interconnect). Questa comunicazione avviene tramite una connessione in peering Virtual Private Cloud (VPC).
I profili di connessione rappresentano le informazioni di connettività sia a un'origine
sia a una destinazione. Queste informazioni verranno utilizzate da uno stream.
Gli stream utilizzano le informazioni nei profili di connessione per trasferire i dati CDC e di backfill dall'origine alla destinazione.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eDatastream is a serverless change data capture (CDC) and replication service that synchronizes data from various operational databases, including Oracle, MySQL, SQL Server, PostgreSQL, and Salesforce, into BigQuery, Cloud Storage, and other destinations.\u003c/p\u003e\n"],["\u003cp\u003eThis service offers low-latency data replication, enabling near real-time insights, seamless scaling, and easy setup and monitoring without the need for manual resource management.\u003c/p\u003e\n"],["\u003cp\u003eDatastream integrates with Google Cloud's data services like Dataflow, Pub/Sub, and BigQuery to build ELT pipelines and is designed to unify data streams across heterogeneous databases and applications.\u003c/p\u003e\n"],["\u003cp\u003eThe platform supports a variety of use cases, such as analytics, database replication, migration and synchronization across hybrid-cloud environments, and building event-driven architectures with minimal latency.\u003c/p\u003e\n"]]],[],null,["# Datastream overview\n\nDatastream is a serverless and easy-to-use change data capture (CDC) and replication service that lets you synchronize data reliably, and with minimal latency.\n\nDatastream provides seamless replication of data from operational databases into BigQuery. In addition, Datastream supports writing the change event stream into Cloud Storage, and offers streamlined integration with Dataflow templates to build custom workflows for loading data into a wide range of destinations, such as Cloud SQL and Spanner. You can also use Datastream to take advantage of the event stream directly from Cloud Storage to realize event-driven architectures. Datastream supports Oracle, MySQL, SQL Server, PostgreSQL (including AlloyDB for PostgreSQL), MongoDB ([Preview](/products#product-launch-stages)) and Salesforce ([Preview](/products#product-launch-stages)) sources.\n\nBenefits of Datastream include:\n\n- Seamless setup of ELT (Extract, Load, Transform) pipelines for low-latency data replication to enable near real-time insights in BigQuery.\n- Being serverless so there are no resources to provision or manage, and the service scales up and down automatically, as needed, with minimal downtime.\n- Easy-to-use setup and monitoring experiences that achieve super-fast time-to-value.\n- Integration across the best of Google Cloud data services' portfolio for data integration across Datastream, Dataflow, Pub/Sub, BigQuery, and more.\n- Synchronizing and unifying data streams across heterogeneous databases and applications.\n- Security, with private connectivity options and the security you expect from Google Cloud.\n- Being accurate and reliable, with transparent status reporting and robust processing flexibility in the face of data and schema changes.\n- Supporting multiple use cases, including analytics, database replication, and synchronization for migrations and hybrid-cloud configurations, and for building event-driven architectures.\n\nUse cases\n---------\n\nThe streaming capabilities of Datastream enable a variety of use cases:\n\n- **Replicating and synchronizing data across your organization with minimal\n latency**\n\n You can synchronize data across heterogeneous databases and applications\n reliably, with low latency, and with minimal impact to the performance of\n your source. Unlock the power of data streams for analytics, database\n replication, cloud migration, and event-driven architectures across hybrid\n environments.\n- **Scale up or down with a serverless architecture seamlessly**\n\n Get up and running fast with a serverless and easy-to-use service that\n scales seamlessly as your data volumes shift. Focus on deriving up-to-date\n insights from your data and responding to high-priority issues, instead of\n managing infrastructure, performance tuning, or resource provisioning.\n- **Integrate with the Google Cloud data integration suite**\n\n Connect data across your organization with the Google Cloud data\n integration suite of products. Integrate Datastream with\n Dataflow job templates to read data from a Cloud Storage bucket\n and load it into a variety of destinations, such as BigQuery,\n Spanner, and Cloud SQL.\n\nExperience elements\n-------------------\n\nThere are three main elements in Datastream:\n\n- **Private connectivity configurations** enable Datastream to communicate with a data source over a private network (internally within Google Cloud, or with external sources connected over VPN or Interconnect). This communication happens through a Virtual Private Cloud (VPC) peering connection.\n- **Connection profiles** represent connectivity information to both a source and a destination. This information will be used by a stream.\n- **Streams** use the information in the connection profiles to transfer CDC and backfill data from the source to the destination.\n\nWhat's next\n-----------\n\n- Start replicating your data [from a source database to BigQuery datasets](/datastream/docs/quickstart-replication-to-bigquery).\n- Learn more about [key concepts and features](/datastream/docs/behavior-overview) of Datastream.\n- Find out how to create [private connectivity configurations](/datastream/docs/create-a-private-connectivity-configuration), [connection profiles](/datastream/docs/create-connection-profiles) and [streams](/datastream/docs/create-a-stream)."]]