Ringkasan Datastream

Ringkasan

Datastream adalah layanan replikasi dan pengambilan data perubahan (CDC) tanpa server dan mudah digunakan yang memungkinkan Anda menyinkronkan data dengan andal dan dengan latensi minimal.

Datastream menyediakan replikasi data yang lancar dari database operasional ke BigQuery. Selain itu, Datastream mendukung penulisan aliran peristiwa perubahan ke Cloud Storage, dan menawarkan integrasi yang disederhanakan dengan template Dataflow untuk membuat alur kerja kustom guna memuat data ke berbagai tujuan, seperti Cloud SQL dan Spanner. Anda juga dapat menggunakan Datastream untuk memanfaatkan aliran peristiwa langsung dari Cloud Storage guna mewujudkan arsitektur berbasis peristiwa. Datastream mendukung sumber Oracle, MySQL, SQL Server (Pratinjau) dan PostgreSQL (termasuk AlloyDB untuk PostgreSQL).

Manfaat Datastream meliputi:

  • Penyiapan yang mudah dari pipeline ELT (Ekstrak, Muat, Transformasi) untuk replikasi data latensi rendah guna memungkinkan insight yang mendekati real-time di BigQuery.
  • Karena tanpa server sehingga tidak ada resource yang harus disediakan atau dikelola, layanan ini akan otomatis menaikkan dan menurunkan skala sesuai kebutuhan dengan periode nonaktif minimal.
  • Pengalaman penyiapan dan pemantauan yang mudah digunakan yang mencapai waktu pemerolehan manfaat super cepat.
  • Integrasi di seluruh portofolio layanan data Google Cloud terbaik untuk integrasi data di Datastream, Dataflow, Cloud Data Fusion, Pub/Sub, BigQuery, dan lainnya.
  • Menyinkronkan dan menyatukan aliran data di berbagai database dan aplikasi yang heterogen.
  • Keamanan, dengan opsi konektivitas pribadi dan keamanan yang Anda harapkan dari Google Cloud.
  • Memberikan informasi yang akurat dan andal, dengan pelaporan status yang transparan dan fleksibilitas pemrosesan yang andal dalam menghadapi perubahan data dan skema.
  • Mendukung beberapa kasus penggunaan, termasuk analisis, replikasi database, dan sinkronisasi untuk migrasi dan konfigurasi hybrid cloud, serta untuk membangun arsitektur berbasis peristiwa.

Kasus penggunaan

Kemampuan streaming Datastream memungkinkan berbagai kasus penggunaan:

  • Mereplikasi dan menyinkronkan data di seluruh organisasi dengan latensi minimal

    Anda dapat menyinkronkan data di berbagai database dan aplikasi heterogen secara andal, dengan latensi rendah, dan minim dampak pada performa sumber. Manfaatkan potensi aliran data untuk analisis, replikasi database, migrasi cloud, dan arsitektur berbasis peristiwa di lingkungan hybrid.

  • Tingkatkan atau turunkan skala dengan arsitektur serverless secara lancar

    Siapkan dan jalankan secara cepat dengan layanan tanpa server dan mudah digunakan yang dapat diskalakan dengan lancar seiring perubahan volume data Anda. Berfokuslah untuk mendapatkan insight terbaru dari data Anda dan merespons masalah prioritas tinggi, bukan mengelola infrastruktur, penyesuaian performa, atau penyediaan resource.

  • Berintegrasi dengan suite integrasi data Google Cloud

    Hubungkan data di seluruh organisasi Anda dengan rangkaian produk integrasi data Google Cloud. Datastream memanfaatkan template Dataflow untuk memuat data ke BigQuery, Spanner, dan Cloud SQL, serta mendukung konektor Replicator CDC Cloud Data Fusion untuk pipeline data yang lebih mudah dari sebelumnya.

Elemen pengalaman

Ada tiga elemen utama yang membentuk Datastream:

  • Konfigurasi konektivitas pribadi memungkinkan Datastream berkomunikasi dengan sumber data melalui jaringan pribadi (secara internal dalam Google Cloud, atau dengan sumber eksternal yang terhubung melalui VPN atau Interconnect). Komunikasi ini terjadi melalui koneksi peering Virtual Private Cloud (VPC).
  • Profil koneksi mewakili informasi konektivitas ke sumber dan tujuan. Informasi ini akan digunakan oleh streaming.
  • Aliran menggunakan informasi di profil koneksi untuk mentransfer CDC dan mengisi ulang data dari sumber ke tujuan.