Mengonfigurasi database PostgreSQL yang dikelola sendiri untuk CDC

Halaman ini menjelaskan cara mengonfigurasi change data capture (CDC) untuk mengalirkan data dari database PostgreSQL yang dikelola sendiri ke tujuan yang didukung, seperti BigQuery atau Cloud Storage.

Mengaktifkan replikasi logis di database

  1. Tetapkan parameter wal_level di database Anda dengan menambahkan wal_level=logical ke file postgresql.conf.

  2. Mulai ulang server.

Buat publikasi dan slot replikasi

  1. Login ke konsol PostgreSQL sebagai superuser.

  2. Buat publikasi. Sebaiknya buat publikasi hanya untuk tabel yang ingin direplikasi. Hal ini memungkinkan Datastream membaca saja data yang relevan, dan mengurangi beban pada database dan Datastream:

    CREATE PUBLICATION PUBLICATION_NAME
    FOR TABLE SCHEMA1.TABLE1, SCHEMA2.TABLE2;

    Ganti kode berikut:

    • PUBLICATION_NAME: Nama publikasi Anda. Anda harus memberikan nama ini saat membuat aliran data di wizard pembuatan aliran Datastream.
    • SCHEMA: Nama skema yang berisi tabel.
    • TABLE: Nama tabel yang ingin Anda replikasi.

    Anda dapat membuat publikasi untuk semua tabel dalam skema. Pendekatan ini memungkinkan Anda mereplikasi perubahan untuk tabel dalam daftar skema yang ditentukan, termasuk tabel yang Anda buat di masa mendatang:

    CREATE PUBLICATION PUBLICATION_NAME
    FOR TABLES IN SCHEMA SCHEMA1, SCHEMA2;

    Anda juga dapat membuat publikasi untuk semua tabel di database Anda. Perhatikan bahwa pendekatan ini meningkatkan beban pada database sumber dan Datastream:

    CREATE PUBLICATION PUBLICATION_NAME FOR ALL TABLES;
    
  3. Buat slot replikasi dengan memasukkan perintah SQL berikut:

    SELECT PG_CREATE_LOGICAL_REPLICATION_SLOT('REPLICATION_SLOT_NAME', 'pgoutput');

    Ganti kode berikut:

    • REPLICATION_SLOT_NAME: Nama slot replikasi Anda. Anda harus memberikan nama ini saat membuat stream di wizard pembuatan stream Datastream.

Membuat pengguna Datastream

  1. Untuk membuat pengguna Datastream, masukkan perintah SQL berikut:

    CREATE USER USER_NAME WITH ENCRYPTED PASSWORD 'USER_PASSWORD';

    Ganti kode berikut:

    • USER_NAME: Nama pengguna Datastream yang ingin Anda buat.
    • USER_PASSWORD: Sandi login untuk pengguna Datastream yang ingin Anda buat.
  2. Berikan hak istimewa berikut kepada pengguna yang Anda buat:

    ALTER ROLE USER_NAME WITH REPLICATION;
    GRANT SELECT ON ALL TABLES IN SCHEMA SCHEMA_NAME TO USER_NAME;
    GRANT USAGE ON SCHEMA SCHEMA_NAME TO USER_NAME;
    ALTER DEFAULT PRIVILEGES IN SCHEMA SCHEMA_NAME
      GRANT SELECT ON TABLES TO USER_NAME;
    

    Ganti kode berikut:

    • USER_NAME: Pengguna yang ingin Anda beri hak istimewa.
    • SCHEMA_NAME: Nama skema yang ingin Anda beri hak istimewa.

Langkah berikutnya