Configurar una base de datos de Cloud SQL para PostgreSQL para CDC

En esta página se describe cómo configurar la captura de datos de cambios (CDC) para transmitir datos de una base de datos de Cloud SQL para PostgreSQL a un destino admitido, como BigQuery o Cloud Storage.

Habilitar la replicación lógica

  1. Ve a Cloud SQL en la Google Cloud consola.

  2. Abre la instancia de Cloud SQL y haz clic en EDITAR.

  3. Ve a la sección Banderas.

  4. Haz clic en AÑADIR MARCA.

  5. Selecciona la bandera cloudsql.logical_decoding en el menú desplegable.

  6. Asigna el valor on a la marca.

  7. Haz clic en GUARDAR para guardar los cambios. Tendrás que reiniciar tu instancia para actualizarla con los cambios.

  8. Una vez que se haya reiniciado la instancia, confirma los cambios en Database flags (Indicadores de base de datos) en la página Overview (Resumen).

Crear una publicación y un slot de replicación

  1. Conéctate a la base de datos como usuario con los privilegios suficientes para crear un slot de replicación. De lo contrario, ejecuta el siguiente comando:

    ALTER USER USER_NAME WITH REPLICATION;
    

    Haz los cambios siguientes:

    • USER_NAME: el nombre del usuario al que quieres conceder privilegios de replicación.
  2. Crea una publicación. Te recomendamos que crees una publicación solo para las tablas que quieras replicar. De esta forma, Datastream puede leer los datos relevantes y se reduce la carga de la base de datos y de Datastream:

    CREATE PUBLICATION PUBLICATION_NAME
    FOR TABLE SCHEMA1.TABLE1, SCHEMA2.TABLE2;

    Haz los cambios siguientes:

    • PUBLICATION_NAME: el nombre de tu publicación. Deberá proporcionar este nombre cuando cree un flujo en el asistente de creación de flujos de Datastream.
    • SCHEMA: el nombre del esquema que contiene la tabla.
    • TABLE: el nombre de la tabla que quieres replicar.

    También puede crear una publicación para todas las tablas de su base de datos. Tenga en cuenta que este enfoque aumenta la carga tanto en la base de datos de origen como en Datastream:

    CREATE PUBLICATION PUBLICATION_NAME FOR ALL TABLES;
    
  3. Crea un slot de replicación introduciendo el siguiente comando SQL:

    SELECT PG_CREATE_LOGICAL_REPLICATION_SLOT('REPLICATION_SLOT_NAME', 'pgoutput');

    Haz los cambios siguientes:

    • REPLICATION_SLOT_NAME: el nombre de tu ranura de replicación. Deberá proporcionar este nombre cuando cree un flujo en el asistente de creación de flujos de datos.

Crear un usuario de Datastream

  1. Conéctate a la base de datos mediante un cliente de PostgreSQL.

  2. Introduce el siguiente comando de PostgreSQL:

    CREATE USER USER_NAME WITH REPLICATION LOGIN PASSWORD 'USER_PASSWORD';

    Haz los cambios siguientes:

    • USER_NAME: nombre del usuario de Datastream que quieras crear.
    • USER_PASSWORD: la contraseña de inicio de sesión del usuario de flujo de datos que quieras crear.
  3. Concede los siguientes privilegios al usuario que has creado:

    GRANT SELECT ON ALL TABLES IN SCHEMA SCHEMA_NAME TO USER_NAME;
    GRANT USAGE ON SCHEMA SCHEMA_NAME TO USER_NAME;
    ALTER DEFAULT PRIVILEGES IN SCHEMA SCHEMA_NAME
        GRANT SELECT ON TABLES TO USER_NAME;
    

    Haz los cambios siguientes:

    • SCHEMA_NAME: el nombre del esquema al que quieres conceder los privilegios.
    • USER_NAME: el usuario al que quieres conceder los privilegios.

Siguientes pasos