Agrega tablas a un trabajo de replicación

Después de implementar un trabajo de replicación, no puedes editar ni agregar tablas a él. En su lugar, agrega las tablas a un trabajo de replicación nuevo o duplicado.

Opción 1: Crea un trabajo de replicación nuevo

El enfoque más sencillo es agregar tablas a un trabajo nuevo. Evita la recarga histórica de todas las tablas y evita problemas de inconsistencia de datos.

Las desventajas son el aumento de la sobrecarga de administrar varios trabajos de replicación y el consumo de más recursos de procesamiento, ya que cada trabajo se ejecuta en un clúster efímero de Dataproc independiente de forma predeterminada. Esto último se puede mitigar en cierta medida con el uso de un clúster de Dataproc estático compartido para ambas tareas.

Para obtener más información sobre cómo crear trabajos nuevos, consulta los instructivos de replicación.

Para obtener más información sobre el uso de clústeres estáticos de Dataproc en Cloud Data Fusion, consulta Ejecuta una canalización en un clúster existente de Dataproc

Opción 2: Detener el trabajo de replicación actual y crear un duplicado

Si duplicas el trabajo de replicación para agregar las tablas, ten en cuenta lo siguiente:

  • Si habilitas la instantánea para el trabajo duplicado, se cargará el historial de todas las tablas desde cero. Esto se recomienda si no puedes usar la opción anterior, en la que ejecutas trabajos independientes.

  • Inhabilitar la instantánea para evitar la carga histórica puede provocar la pérdida de datos, ya que podría haber eventos perdidos entre el momento en que se detiene la canalización anterior y comienza la nueva. No se recomienda crear una superposición para mitigar este problema, ya que también puede provocar la pérdida de datos, ya que no se replican los datos históricos de las tablas nuevas.

Para crear una tarea de replicación duplicada, sigue estos pasos:

  1. Detén la canalización existente.

  2. En la página Trabajos de replicación, busca el trabajo que deseas duplicar, haz clic en y, luego, en Duplicar.

  3. Habilita la instantánea:

    1. Ve a Configurar fuente.
    2. En el campo Replicar datos existentes, selecciona .
  4. Agrega tablas en la ventana Select tables and transformations y sigue el asistente para implementar la canalización de replicación.

¿Qué sigue?