Configurar una base de datos PostgreSQL de Amazon RDS para CDC
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
En esta página se describe cómo configurar la captura de datos de cambios (CDC) para transmitir datos de una base de datos de Amazon RDS para PostgreSQL a un destino compatible, como BigQuery o Cloud Storage.
Crear un grupo de parámetros
Abre el panel de control de Amazon RDS.
En el panel de navegación, haga clic en Grupos de parámetros y, a continuación, en Crear grupo de parámetros. Se mostrará la página Crear grupo de parámetros.
Selecciona la familia de bases de datos que coincida con tu base de datos, proporciona un nombre y una descripción para el grupo de parámetros y, a continuación, haz clic en Crear.
Marca la casilla situada a la izquierda del grupo de parámetros que acabas de crear y, a continuación, en Acciones del grupo de parámetros, haz clic en Editar.
Defina el siguiente parámetro para su grupo.
Parámetro
Valor
rds.logical_replication
1
Haz clic en Guardar cambios.
Configurar la base de datos de origen
Abre el panel de control de Amazon RDS.
En el cajón de navegación, haz clic en Bases de datos.
En Programación de modificaciones, selecciona Aplicar inmediatamente.
Verificar que el grupo de parámetros está asignado a la instancia de base de datos
Abre el panel de control de Amazon RDS.
En el cajón de navegación, haga clic en Bases de datos y, a continuación, seleccione su instancia de base de datos.
Haz clic en la pestaña Configuraciones.
Comprueba que ves el grupo de parámetros que has creado y que su estado es pending-reboot.
Reinicia la instancia de base de datos para completar la configuración. Para reiniciar la instancia:
En el cajón de navegación, haz clic en Instancias.
Selecciona tu instancia de base de datos.
En el menú Acciones de la instancia, selecciona Reiniciar.
Crear una publicación y un slot de replicación
Crea una publicación. Te recomendamos que crees una publicación solo para las tablas que quieras replicar. De esta forma, Datastream puede leer los datos relevantes y se reduce la carga de la base de datos y de Datastream:
CREATE PUBLICATION PUBLICATION_NAME
FOR TABLE SCHEMA1.TABLE1, SCHEMA2.TABLE2;
Haz los cambios siguientes:
PUBLICATION_NAME: el nombre de tu publicación. Deberá proporcionar este nombre cuando cree un flujo en el asistente de creación de flujos de Datastream.
SCHEMA: el nombre del esquema que contiene la tabla.
TABLE: el nombre de la tabla que quieres replicar.
También puede crear una publicación para todas las tablas de su base de datos. Tenga en cuenta que este enfoque aumenta la carga tanto en la base de datos de origen como en Datastream:
CREATE PUBLICATION PUBLICATION_NAME FOR ALL TABLES;
Crea un slot de replicación introduciendo el siguiente comando de PostgreSQL:
REPLICATION_SLOT_NAME: el nombre de tu ranura de replicación. Deberá proporcionar este nombre cuando cree un flujo en el asistente de creación de flujos de Datastream.
Crear un usuario de Datastream
Para crear un usuario de Datastream, introduce el siguiente comando de PostgreSQL:
CREATE USER USER_NAME WITH ENCRYPTED PASSWORD 'USER_PASSWORD';
Haz los cambios siguientes:
USER_NAME: nombre del usuario de Datastream que quieres crear.
USER_PASSWORD: la contraseña de inicio de sesión del usuario de flujo de datos que quieras crear.
Concede los siguientes privilegios al usuario que has creado:
GRANT RDS_REPLICATION TO USER_NAME;
GRANT SELECT ON ALL TABLES IN SCHEMA SCHEMA_NAME TO USER_NAME;
GRANT USAGE ON SCHEMA SCHEMA_NAME TO USER_NAME;
ALTER DEFAULT PRIVILEGES IN SCHEMA SCHEMA_NAME
GRANT SELECT ON TABLES TO USER_NAME;
Haz los cambios siguientes:
USER_NAME: el usuario al que quieres conceder los privilegios.
SCHEMA_NAME: el nombre del esquema al que quieres conceder los privilegios.
Siguientes pasos
Consulta más información sobre cómo funciona Datastream con las fuentes de PostgreSQL.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-10 (UTC)."],[[["\u003cp\u003eThis page outlines the steps to configure Change Data Capture (CDC) for an Amazon RDS for PostgreSQL database, beginning with creating and modifying a database parameter group.\u003c/p\u003e\n"],["\u003cp\u003eConfiguring the source database involves assigning the newly created parameter group and applying it immediately, which requires a mandatory wait period for these changes to be properly applied.\u003c/p\u003e\n"],["\u003cp\u003eTo enable CDC, you must create a publication, either for specific tables or all tables, and a replication slot within the PostgreSQL database to track data changes.\u003c/p\u003e\n"],["\u003cp\u003eA dedicated Datastream user must be created with specific privileges like \u003ccode\u003eRDS_REPLICATION\u003c/code\u003e and \u003ccode\u003eSELECT\u003c/code\u003e access on relevant tables and schemas to facilitate data replication.\u003c/p\u003e\n"],["\u003cp\u003eVerifying the correct parameter group assignment requires a reboot of the database instance, after which the parameter group status should show as in-sync, indicating successful application of the changes.\u003c/p\u003e\n"]]],[],null,["# Configure an Amazon RDS PostgreSQL database\n\nThe following page covers how to configure CDC for an Amazon RDS for PostgreSQL database.\n\n### Create a parameter group\n\n1. Launch your Amazon RDS Dashboard.\n\n2. In the **Navigation Drawer** , click **Parameter Groups** , and then click **Create Parameter Group** . The **Create Parameter Group** page appears.\n\n3. Select the database family that matches your database, provide a name and description for the parameter group, and then click **Create**.\n\n4. Select the checkbox to the left of your newly created parameter group, and then, under **Parameter group actions** , click **Edit**.\n\n5. Set the following parameter for your group.\n\n6. Click **Save Changes**.\n\n | For PostgreSQL 13 and later, it is recommended that you also set the `max_slot_wal_keep_size` parameter in the `postgresql.conf` file to limit the amount of storage used by replication slots. For more information, see [Work with PostgreSQL database WAL log files](/datastream/docs/work-with-postgresql-database-wal-log-files).\n\n### Configure the source database\n\n1. Launch your Amazon RDS Dashboard.\n\n2. In the **Navigation Drawer** , click **Databases**.\n\n3. Select your source, and then click **Modify**.\n\n4. Go to the **Additional configuration** section.\n\n5. Select the parameter group that you [created](#create-a-parameter-group-rds).\n\n6. Click **Continue**.\n\n7. Under **Scheduling of modifications** , select **Apply immediately**.\n\n | Because you modified your source, you must wait until the changes to your parameter group are applied before proceeding.\n\n### Verify that the parameter group is assigned to the database instance\n\n1. Launch your Amazon RDS Dashboard.\n\n2. In the **Navigation Drawer** , click **Databases**, and then select your database instance.\n\n3. Click the **Configurations** tab.\n\n4. Verify that you see the parameter group that you [created](#create-a-parameter-group-rds), and that its status is **pending-reboot**.\n\n5. Reboot your database instance to complete the configuration. To reboot the instance:\n\n 1. In the **Navigation Drawer** , click **Instances**.\n 2. Select your database instance.\n 3. From the **Instance Actions** menu, select **Reboot**.\n\n | After you reboot your database instance, its status changes to **in-sync**.\n\n### Create a publication and a replication slot\n\n1. Create a publication. We recommend that you create a publication only for the\n tables that you want to replicate. This allows Datastream to read-only\n the relevant data, and lowers the load on the database and Datastream:\n\n ```\n CREATE PUBLICATION PUBLICATION_NAME\n FOR TABLE SCHEMA1.TABLE1, SCHEMA2.TABLE2;\n ```\n\n Replace the following:\n - \u003cvar translate=\"no\"\u003ePUBLICATION_NAME\u003c/var\u003e: The name of your publication. You'll need to provide this name when you create a stream in the Datastream stream creation wizard.\n - \u003cvar translate=\"no\"\u003eSCHEMA\u003c/var\u003e: The name of the schema that contains the table.\n - \u003cvar translate=\"no\"\u003eTABLE\u003c/var\u003e: The name of the table that you want to replicate.\n\n You can also create a publication for all tables in your database. Note that\n this approach increases the load on both the source database and Datastream: \n\n ```\n CREATE PUBLICATION PUBLICATION_NAME FOR ALL TABLES;\n ```\n | For PostgreSQL 15 and later, you can create a publication for all tables in a schema. This approach lets you replicate changes for tables in the specified list of schemas, including tables that you create in the future: \n |\n | ```\n | CREATE PUBLICATION PUBLICATION_NAME\n | FOR TABLES IN SCHEMA SCHEMA1, SCHEMA2;\n | ```\n2. Create a replication slot by entering the following PostgreSQL command:\n\n ```\n SELECT PG_CREATE_LOGICAL_REPLICATION_SLOT('REPLICATION_SLOT_NAME', 'pgoutput'); \n ```\n\n \u003cbr /\u003e\n\n Replace the following:\n - \u003cvar translate=\"no\"\u003eREPLICATION_SLOT_NAME\u003c/var\u003e: The name of your replication slot. You'll need to provide this name when you create a stream in the Datastream stream creation wizard.\n\n | The replication slot must be unique for each stream that's replicating from this database.\n\n### Create a Datastream user\n\n1. To create a Datastream user, enter the following PostgreSQL command:\n\n ```\n CREATE USER USER_NAME WITH ENCRYPTED PASSWORD 'USER_PASSWORD';\n ```\n\n Replace the following:\n - \u003cvar translate=\"no\"\u003eUSER_NAME\u003c/var\u003e: The name of the Datastream user that you want to create.\n - \u003cvar translate=\"no\"\u003eUSER_PASSWORD\u003c/var\u003e: The login password for the Datastream user that you want to create.\n2. Grant the following privileges to the user you created:\n\n ```\n GRANT RDS_REPLICATION TO USER_NAME;\n GRANT SELECT ON ALL TABLES IN SCHEMA SCHEMA_NAME TO USER_NAME;\n GRANT USAGE ON SCHEMA SCHEMA_NAME TO USER_NAME;\n ALTER DEFAULT PRIVILEGES IN SCHEMA SCHEMA_NAME\n GRANT SELECT ON TABLES TO USER_NAME;\n ```\n\n Replace the following:\n - \u003cvar translate=\"no\"\u003eUSER_NAME\u003c/var\u003e: The user to whom you want to grant the privileges.\n - \u003cvar translate=\"no\"\u003eSCHEMA_NAME\u003c/var\u003e: The name of the schema to which you want to grant the privileges.\n\nWhat's next\n-----------\n\n- Learn more about how Datastream works with [PostgreSQL sources](/datastream/docs/sources-postgresql)."]]