Mengalirkan perubahan pada data secara mendekati real-time dengan Datastream

Sebelum memulai

  1. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  2. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  3. Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.

  4. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  5. Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.

  6. Aktifkan Datastream API.

    Mengaktifkan API

  7. Pastikan Anda memiliki peran Admin Datastream yang ditetapkan ke akun pengguna.

    Buka halaman IAM

Jika ingin membuat konfigurasi konektivitas pribadi untuk jaringan VPC standar atau bersama, Anda harus menyelesaikan prasyarat tambahan. Untuk mengetahui informasi selengkapnya, lihat Membuat konfigurasi konektivitas pribadi.

Persyaratan

Datastream menawarkan berbagai opsi sumber, opsi tujuan, dan metode konektivitas jaringan.

Dalam panduan memulai ini, kami mengasumsikan bahwa Anda menggunakan database Oracle mandiri dan layanan Cloud Storage tujuan. Untuk database sumber, Anda harus dapat mengonfigurasi jaringan untuk menambahkan aturan firewall masuk. Database sumber dapat berupa lokal atau di penyedia cloud. Karena tujuannya adalah Cloud Storage, file harus berada di penyedia cloud Google.

Karena kami tidak dapat mengetahui secara spesifik lingkungan Anda, kami tidak dapat memberikan langkah-langkah mendetail mengenai konfigurasi jaringan Anda.

Untuk panduan memulai ini, Anda harus memilih Pemberian izin IP sebagai metode konektivitas. Pemberian izin IP adalah fitur keamanan yang sering digunakan untuk membatasi dan mengontrol akses ke data di database sumber Anda untuk pengguna tepercaya. Anda dapat menggunakan daftar IP yang diizinkan untuk membuat daftar alamat IP atau rentang IP tepercaya tempat pengguna dan layanan Cloud lainnya seperti Datastream dapat mengakses data ini. Untuk menggunakan daftar IP yang diizinkan, Anda harus membuka database sumber atau firewall ke koneksi masuk dari Datastream.

Membuat profil koneksi

Dengan membuat profil koneksi untuk database sumber dan tujuan, Anda akan membuat kumpulan data yang berisi informasi tentang sumber dan tujuannya.

Dalam panduan memulai ini, Anda akan memilih Oracle sebagai jenis profil untuk profil koneksi sumber, dan Cloud Storage sebagai jenis profil untuk profil koneksi tujuan Anda. Datastream menggunakan informasi dalam profil koneksi untuk memigrasikan data dari database Oracle sumber ke bucket tujuan di Cloud Storage.

Membuat profil koneksi sumber untuk database Oracle

  1. Buka halaman Connection profile untuk Datastream di Google Cloud Console.

    Buka halaman Connection profile

  2. Klik BUAT PROFIL.

  3. Di halaman Create a connection profile, klik jenis profil Oracle (karena Anda ingin membuat profil koneksi sumber untuk database Oracle).

  4. Berikan informasi berikut di bagian Tentukan setelan koneksi di halaman Buat profil Oracle:

    • Masukkan My Source Connection Profile sebagai Nama profil koneksi untuk database sumber Anda.
    • Simpan ID profil koneksi yang dibuat otomatis.
    • Pilih Region tempat profil koneksi akan disimpan.

    • Masukkan Detail koneksi:

      • Di kolom Hostname atau IP, masukkan nama host atau alamat IP publik yang dapat digunakan Datastream untuk terhubung ke database Oracle sumber. Anda memberikan alamat IP publik karena daftar IP yang diizinkan akan digunakan sebagai metode konektivitas jaringan untuk panduan memulai ini.
      • Di kolom Port, masukkan nomor port yang direservasi untuk database sumber. Untuk database Oracle, port defaultnya biasanya 1521.
      • Masukkan Username dan Password untuk melakukan autentikasi ke database sumber.
      • Di kolom System identifier (SID), masukkan SID atau nama layanan yang mengidentifikasi instance database. Untuk database Oracle, nilai ini biasanya ORCL.
  5. Di bagian Tentukan setelan koneksi, klik LANJUTKAN. Bagian Tentukan metode konektivitas di halaman Buat profil Oracle aktif.

  6. Pilih metode jaringan yang ingin Anda gunakan untuk membuat konektivitas antara Aliran Data dan database sumber. Untuk panduan memulai ini, gunakan menu drop-down Metode konektivitas untuk memilih Daftar IP yang diizinkan sebagai metode jaringan.

  7. Konfigurasikan database sumber Anda untuk mengizinkan koneksi masuk dari alamat IP publik Datastream yang muncul.

  8. Di bagian Tentukan metode konektivitas, klik LANJUTKAN. Bagian Test connection profile di halaman Create Oracle profile akan aktif.

  9. Klik RUN TEST untuk memverifikasi bahwa database Oracle sumber dan Datastream dapat saling berkomunikasi.

  10. Pastikan status "Pengujian lulus" muncul.

  11. Jika pengujian gagal, Anda dapat mengatasi masalah di bagian alur yang sesuai, kemudian kembali untuk menguji ulang. Lihat halaman Diagnosis masalah untuk mengetahui langkah-langkah pemecahan masalah.

  12. Klik CREATE.

Membuat profil koneksi tujuan untuk Cloud Storage

  1. Buka halaman Connection profile untuk Datastream di Google Cloud Console.

    Buka halaman Connection profile

  2. Klik BUAT PROFIL.

  3. Di halaman Create a connection profile, klik jenis profil Cloud Storage (karena Anda ingin membuat profil koneksi tujuan untuk Cloud Storage).

  4. Berikan informasi berikut di halaman Create Cloud Storage profile:

    • Masukkan My Destination Connection Profile sebagai Nama profil koneksi untuk layanan Cloud Storage tujuan Anda.
    • Simpan ID profil koneksi yang dibuat otomatis.
    • Pilih Region tempat profil koneksi akan disimpan.
    • Di panel Connection details, klik JELAJAHI.
    • Di panel Select bucket, pilih bucket tujuan di Cloud Storage tempat Datastream akan mentransfer data dari database sumber, lalu klik SELECT.

      Bucket Anda akan muncul di kolom Bucket name pada halaman Create Cloud Storage profile.

    • Secara opsional, di kolom Awalan jalur profil koneksi, Anda dapat memberikan awalan untuk jalur yang akan ditambahkan ke nama bucket saat Datastream mentransfer data ke tujuan.

  5. Klik CREATE.

Setelah membuat profil koneksi sumber untuk database Oracle dan profil koneksi tujuan untuk Cloud Storage, Anda dapat menggunakannya untuk membuat aliran data.

Membuat stream

Di bagian ini, Anda akan membuat streaming. Datastream menggunakan aliran data ini untuk mentransfer data dari database Oracle sumber ke bucket tujuan di Cloud Storage.

Membuat streaming mencakup:

  • Menentukan setelan untuk streaming.
  • Memilih profil koneksi yang Anda buat untuk database sumber (profil koneksi sumber). Untuk panduan memulai, panduan ini adalah Profil Koneksi My Source.
  • Mengonfigurasi informasi tentang database sumber untuk aliran data dengan menentukan tabel dan skema di database sumber yang Datastream:
    • Dapat ditransfer ke tujuan.
    • Dibatasi agar tidak dapat ditransfer ke tujuan.
  • Menentukan apakah Datastream akan mengisi ulang data historis, serta mengalirkan perubahan yang sedang berlangsung ke tujuan, atau hanya mengalirkan perubahan pada data.
  • Memilih profil koneksi yang Anda buat untuk Cloud Storage (profil koneksi tujuan). Untuk panduan memulai, ini adalah Profil Koneksi Destinasi Saya.
  • Mengonfigurasi informasi tentang bucket tujuan untuk streaming. Informasi ini mencakup:
    • Folder bucket tujuan tempat Datastream akan mentransfer skema, tabel, dan data dari database Oracle sumber.
    • Format output file yang ditulis ke Cloud Storage. Datastream saat ini mendukung dua format output: Avro dan JSON. Untuk panduan memulai ini, Avro adalah format filenya.

Menentukan setelan untuk streaming

  1. Buka halaman Streams untuk Datastream di Google Cloud Console.

    Buka halaman Forum

  2. Klik BUAT STREAMING.

  3. Berikan informasi berikut di panel Tentukan detail aliran data di halaman Buat streaming:

    • Masukkan My Stream sebagai Nama aliran data.
    • Simpan ID Aliran Data yang dibuat otomatis.
    • Dari menu Region, pilih region tempat Anda membuat profil koneksi sumber.
    • Dari menu Jenis sumber, pilih jenis profil Oracle.
    • Dari menu Destination type, pilih jenis profil Cloud Storage.
  4. Tinjau prasyarat yang diperlukan yang dibuat secara otomatis guna mencerminkan cara mempersiapkan lingkungan Anda untuk streaming. Prasyarat ini dapat mencakup cara mengonfigurasi database sumber dan cara menghubungkan Datastream ke bucket tujuan di Cloud Storage.

  5. Klik CONTINUE. Panel Define Oracle connection profile di halaman Create stream akan muncul.

Menentukan informasi tentang profil koneksi sumber

  1. Dari menu Source connection profile, pilih profil koneksi sumber untuk database Oracle.

  2. Klik RUN TEST untuk memverifikasi bahwa database sumber dan Datastream dapat saling berkomunikasi.

    Jika pengujian gagal, masalah yang terkait dengan profil koneksi akan muncul. Lihat halaman Diagnosis masalah untuk mengetahui langkah-langkah pemecahan masalah. Buat perubahan yang diperlukan untuk memperbaiki masalah, lalu uji kembali.

  3. Klik CONTINUE. Panel Konfigurasi sumber streaming di halaman Buat streaming akan muncul.

Mengonfigurasi informasi tentang database sumber untuk aliran data

  1. Gunakan menu Objects to include untuk menentukan tabel dan skema di database sumber yang dapat ditransfer Datastream ke dalam folder di bucket tujuan di Cloud Storage. Menu hanya dimuat jika database Anda memiliki hingga 5.000 objek.

    Untuk panduan memulai ini, Anda ingin Datastream mentransfer semua tabel dan skema. Oleh karena itu, pilih Semua tabel dari semua skema dari menu.

  2. Klik CONTINUE. Panel Define Cloud Storage connection profile di halaman Buat aliran data akan muncul.

Pilih profil koneksi tujuan

  1. Dari menu profil koneksi tujuan, pilih profil koneksi tujuan untuk Cloud Storage.

  2. Klik CONTINUE. Panel Konfigurasi tujuan streaming di halaman Buat streaming akan muncul.

Mengonfigurasi informasi tentang tujuan untuk aliran data

  1. Di kolom Stream pathPrefix, masukkan folder bucket tujuan tempat Datastream akan mentransfer skema, tabel, dan data dari database Oracle sumber.

    Untuk panduan memulai ini, Anda ingin Datastream mentransfer data dari database sumber ke folder /root/tutorial di bucket tujuan Cloud Storage. Oleh karena itu, masukkan /root/tutorial di kolom Awalan jalur aliran data.

  2. Di kolom Output format, pilih format file yang ditulis ke Cloud Storage. Untuk panduan memulai ini, Avro adalah format filenya.

  3. Klik CONTINUE. Panel Tinjau detail aliran data dan buat di halaman Buat aliran data akan muncul.

Membuat feed

  1. Verifikasi detail tentang aliran data serta profil koneksi sumber dan tujuan yang akan digunakan aliran data untuk mentransfer data dari database Oracle sumber ke bucket tujuan di Cloud Storage.

  2. Klik JALANKAN VALIDASI untuk memvalidasi streaming. Dengan memvalidasi streaming, Datastream memeriksa apakah sumber telah dikonfigurasi dengan benar, memvalidasi bahwa streaming dapat terhubung ke sumber dan tujuan, serta memverifikasi konfigurasi streaming secara menyeluruh.

  3. Setelah semua pemeriksaan validasi lulus, klik BUAT.

  4. Di kotak dialog Create stream?, klik CREATE.

Setelah membuat streaming, Anda dapat memulainya.

Memulai streaming

Di bagian sebelumnya dalam panduan memulai, Anda telah membuat streaming, tetapi tidak memulainya. Anda dapat melakukannya sekarang.

Untuk panduan memulai ini, Anda akan membuat dan memulai streaming secara terpisah jika proses pembuatan streaming menyebabkan peningkatan beban pada database sumber Anda. Untuk menunda beban tersebut, buat streaming tanpa memulainya, lalu mulai streaming saat beban bisa terjadi.

Dengan memulai aliran data, Datastream dapat mentransfer data, skema, dan tabel dari database sumber ke tujuan.

  1. Buka halaman Streams untuk Datastream di Google Cloud Console.

    Buka halaman Forum

  2. Centang kotak di sebelah kiri streaming yang ingin Anda mulai. Untuk panduan memulai ini, buka Streaming Saya.

  3. Klik MULAI.

  4. Di kotak dialog, klik MULAI. Status aliran data berubah dari Not started menjadi Starting menjadi Running.

Setelah memulai aliran data, Anda dapat memverifikasi bahwa Datastream telah mentransfer data dari database sumber ke tujuan.

Verifikasi aliran data

Di bagian ini, Anda mengonfirmasi bahwa Datastream mentransfer data dari semua tabel database Oracle sumber ke folder /root/tutorial bucket tujuan Cloud Storage Anda.

  1. Buka halaman Streams untuk Datastream di Google Cloud Console.

    Buka halaman Forum

  2. Klik streaming yang Anda buat. Untuk panduan memulai ini, buka Streaming Saya.

  3. Di halaman Detail aliran data, klik link yang muncul di bawah kolom Jalur penulisan tujuan. Halaman Bucket details pada Cloud Storage akan terbuka di tab terpisah.

  4. Pastikan Anda melihat folder yang merepresentasikan tabel database Oracle sumber Anda.

  5. Klik salah satu folder tabel dan lihat perincian hingga Anda melihat data yang terkait dengan tabel tersebut.

Pembersihan

Agar akun Google Cloud Anda tidak dikenakan biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.

  1. Gunakan Konsol Google Cloud untuk menghapus project, aliran data dan profil koneksi Datastream, serta bucket tujuan Cloud Storage.

Dengan membersihkan resource yang Anda buat di Datastream, resource tersebut tidak akan menghabiskan kuota dan Anda tidak akan ditagih di masa mendatang. Bagian berikut menjelaskan cara menghapus atau menonaktifkan referensi ini.

Menghapus project Anda

Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk panduan memulai ini.

  1. Di Cloud Console, buka halaman Manage resources.

    Buka halaman Kelola resource

  2. Dalam daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.

  3. Di kotak dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Menghapus feed

  1. Buka halaman Streams untuk Datastream di Google Cloud Console.

    Buka halaman Forum

  2. Klik aliran data yang ingin dihapus. Untuk panduan memulai ini, buka Streaming Saya.

  3. Klik JEDA.

  4. Di kotak dialog, klik JEDA.

  5. Di panel Status streaming di halaman Detail streaming, pastikan status streaming adalah Paused.

  6. Klik HAPUS.

  7. Di kotak dialog, masukkan Delete di kolom teks, lalu klik HAPUS.

Menghapus profil koneksi

  1. Buka halaman Connection profile untuk Datastream di Google Cloud Console.

    Buka halaman Connection profile

  2. Centang kotak untuk setiap profil koneksi yang ingin Anda hapus. Untuk panduan memulai ini, centang kotak My Source Connection Profile dan My Destination Connection Profile.

  3. Klik HAPUS.

  4. Di kotak dialog, klik HAPUS.

Menghapus bucket tujuan Cloud Storage

  1. Buka halaman Browser untuk Cloud Storage di Google Cloud Console.

    Buka halaman Browser

  2. Centang kotak di sebelah kiri bucket, lalu klik HAPUS.

  3. Di kotak dialog, masukkan DELETE di kolom teks, lalu klik HAPUS.

Langkah selanjutnya