Datastream은 사용하기 쉬운 서버리스 변경 데이터 캡처(CDC) 및 복제 서비스로서 최소한의 지연 시간으로 데이터를 안정적으로 동기화할 수 있게 해줍니다.
Datastream은 운영 데이터베이스에서 BigQuery로 데이터 복제를 원활하게 지원합니다. 또한 Datastream에서는 Cloud Storage에 변경 이벤트 스트림을 작성할 수 있으며 Dataflow 템플릿과의 간소화된 통합을 제공해 Cloud SQL 및 Spanner와 같은 다양한 대상에 데이터를 로드하는 커스텀 워크플로를 빌드할 수 있습니다. 또한 Datastream을 사용해서 Cloud Storage에서 직접 이벤트 스트림을 활용하여 이벤트 중심 아키텍처를 실현할 수 있습니다. Datastream은 Oracle, MySQL, SQL Server, PostgreSQL(PostgreSQL용 AlloyDB 포함) 소스를 지원합니다.
Datastream의 이점은 다음과 같습니다.
지연 시간이 짧은 데이터 복제를 위한 ELT(추출, 로드, 변환) 파이프라인을 원활하게 설정하여 BigQuery에서 거의 실시간으로 통계를 얻을 수 있음
서버리스이므로 프로비저닝하거나 관리할 리소스가 없으며 최소한의 다운타임으로 서비스가 자동으로 확장 및 축소됨
가치를 더 빠르게 실현할 수 있는 간편한 설정 및 모니터링 환경
Datastream, Dataflow, Pub/Sub, BigQuery 등에서의 데이터 통합이 가능한 최고의 Google Cloud 데이터 서비스 포트폴리오 통합
이기종 데이터베이스 및 애플리케이션 간에 데이터 스트림 동기화 및 통합
비공개 연결 옵션으로 지원되는 보안과 Google Cloud에 기대할 수 있는 보안 기능
데이터 및 스키마 변경 시 투명한 상태 보고 및 강력한 처리 유연성을 제공하여 정확하고 안정적임
마이그레이션 및 하이브리드 클라우드 구성과 이벤트 기반 아키텍처 빌드를 위한 분석, 데이터베이스 복제, 동기화 등 여러 사용 사례를 지원합니다.
사용 사례
Datastream의 스트리밍 기능은 다양한 사용 사례를 지원합니다.
최소한의 지연 시간으로 조직 전체에서 데이터 복제 및 동기화
이기종 데이터베이스와 애플리케이션에서 짧은 지연 시간으로 소스 성능에 미치는 영향을 최소화하면서 안정적으로 데이터를 동기화할 수 있습니다. 하이브리드 환경에서 분석, 데이터베이스 복제, 클라우드 마이그레이션, 이벤트 기반 아키텍처에 데이터 스트림을 활용하세요.
서버리스 아키텍처를 통한 원활한 확장 또는 축소
데이터 볼륨의 변화에 따라 원활하게 확장되는 사용하기 쉬운 서버리스 서비스로 빠르게 준비하고 실행하세요. 인프라, 성능 조정 또는 리소스 프로비저닝을 관리하는 대신 데이터에서 최신 통계를 얻고 우선순위가 높은 문제에 대응하는 데 집중하세요.
Google Cloud의 데이터 통합 제품군과 통합
Google Cloud의 데이터 통합 제품군으로 조직 전체의 데이터를 연결하세요. Datastream은 Dataflow 템플릿을 활용하여 BigQuery, Spanner, Cloud SQL에 데이터를 로드합니다.
환경 요소
Datastream을 구성하는 세 가지 기본 요소가 있습니다.
비공개 연결 구성을 사용하면 Datastream이 비공개 네트워크(내부에서는 Google Cloud 내부 또는 VPN 또는 상호 연결을 통해 연결된 외부 소스)를 통해 데이터 소스와 통신할 수 있습니다. 이 통신은 Virtual Private Cloud(VPC) 피어링 연결을 통해 이루어집니다.
연결 프로필은 소스와 대상 모두에 대한 연결 정보를 나타냅니다. 이 정보는 스트림에 사용됩니다.
스트림은 연결 프로필의 정보를 사용해서 CDC 및 백필 데이터를 소스에서 대상으로 전송합니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[[["\u003cp\u003eDatastream is a serverless change data capture (CDC) and replication service that synchronizes data from various operational databases, including Oracle, MySQL, SQL Server, PostgreSQL, and Salesforce, into BigQuery, Cloud Storage, and other destinations.\u003c/p\u003e\n"],["\u003cp\u003eThis service offers low-latency data replication, enabling near real-time insights, seamless scaling, and easy setup and monitoring without the need for manual resource management.\u003c/p\u003e\n"],["\u003cp\u003eDatastream integrates with Google Cloud's data services like Dataflow, Pub/Sub, and BigQuery to build ELT pipelines and is designed to unify data streams across heterogeneous databases and applications.\u003c/p\u003e\n"],["\u003cp\u003eThe platform supports a variety of use cases, such as analytics, database replication, migration and synchronization across hybrid-cloud environments, and building event-driven architectures with minimal latency.\u003c/p\u003e\n"]]],[],null,["# Datastream overview\n\nDatastream is a serverless and easy-to-use change data capture (CDC) and replication service that lets you synchronize data reliably, and with minimal latency.\n\nDatastream provides seamless replication of data from operational databases into BigQuery. In addition, Datastream supports writing the change event stream into Cloud Storage, and offers streamlined integration with Dataflow templates to build custom workflows for loading data into a wide range of destinations, such as Cloud SQL and Spanner. You can also use Datastream to take advantage of the event stream directly from Cloud Storage to realize event-driven architectures. Datastream supports Oracle, MySQL, SQL Server, PostgreSQL (including AlloyDB for PostgreSQL), MongoDB ([Preview](/products#product-launch-stages)) and Salesforce ([Preview](/products#product-launch-stages)) sources.\n\nBenefits of Datastream include:\n\n- Seamless setup of ELT (Extract, Load, Transform) pipelines for low-latency data replication to enable near real-time insights in BigQuery.\n- Being serverless so there are no resources to provision or manage, and the service scales up and down automatically, as needed, with minimal downtime.\n- Easy-to-use setup and monitoring experiences that achieve super-fast time-to-value.\n- Integration across the best of Google Cloud data services' portfolio for data integration across Datastream, Dataflow, Pub/Sub, BigQuery, and more.\n- Synchronizing and unifying data streams across heterogeneous databases and applications.\n- Security, with private connectivity options and the security you expect from Google Cloud.\n- Being accurate and reliable, with transparent status reporting and robust processing flexibility in the face of data and schema changes.\n- Supporting multiple use cases, including analytics, database replication, and synchronization for migrations and hybrid-cloud configurations, and for building event-driven architectures.\n\nUse cases\n---------\n\nThe streaming capabilities of Datastream enable a variety of use cases:\n\n- **Replicating and synchronizing data across your organization with minimal\n latency**\n\n You can synchronize data across heterogeneous databases and applications\n reliably, with low latency, and with minimal impact to the performance of\n your source. Unlock the power of data streams for analytics, database\n replication, cloud migration, and event-driven architectures across hybrid\n environments.\n- **Scale up or down with a serverless architecture seamlessly**\n\n Get up and running fast with a serverless and easy-to-use service that\n scales seamlessly as your data volumes shift. Focus on deriving up-to-date\n insights from your data and responding to high-priority issues, instead of\n managing infrastructure, performance tuning, or resource provisioning.\n- **Integrate with the Google Cloud data integration suite**\n\n Connect data across your organization with the Google Cloud data\n integration suite of products. Integrate Datastream with\n Dataflow job templates to read data from a Cloud Storage bucket\n and load it into a variety of destinations, such as BigQuery,\n Spanner, and Cloud SQL.\n\nExperience elements\n-------------------\n\nThere are three main elements in Datastream:\n\n- **Private connectivity configurations** enable Datastream to communicate with a data source over a private network (internally within Google Cloud, or with external sources connected over VPN or Interconnect). This communication happens through a Virtual Private Cloud (VPC) peering connection.\n- **Connection profiles** represent connectivity information to both a source and a destination. This information will be used by a stream.\n- **Streams** use the information in the connection profiles to transfer CDC and backfill data from the source to the destination.\n\nWhat's next\n-----------\n\n- Start replicating your data [from a source database to BigQuery datasets](/datastream/docs/quickstart-replication-to-bigquery).\n- Learn more about [key concepts and features](/datastream/docs/behavior-overview) of Datastream.\n- Find out how to create [private connectivity configurations](/datastream/docs/create-a-private-connectivity-configuration), [connection profiles](/datastream/docs/create-connection-profiles) and [streams](/datastream/docs/create-a-stream)."]]