Añadir tablas a un trabajo de replicación

Una vez que hayas implementado un trabajo de replicación, no podrás editarlo ni añadirle tablas. En su lugar, añade las tablas a una tarea de replicación nueva o duplicada.

Opción 1: Crear una tarea de replicación

Añadir tablas a un nuevo trabajo es el método más sencillo. De esta forma, se evita que se vuelvan a cargar todos los historiales de las tablas y que se produzcan problemas de incoherencia de datos.

Los inconvenientes son el aumento de la sobrecarga que supone gestionar varias tareas de replicación y el consumo de más recursos de computación, ya que cada tarea se ejecuta en un clúster de Dataproc efímero independiente de forma predeterminada. Esto último se puede mitigar en cierta medida usando un clúster de Dataproc estático compartido para ambos trabajos.

Para obtener más información sobre cómo crear trabajos, consulta los tutoriales de replicación.

Para obtener más información sobre cómo usar un clúster de Dataproc estático en Cloud Data Fusion, consulta el artículo Ejecutar un flujo de procesamiento en un clúster de Dataproc ya creado.

Opción 2: Detener la tarea de replicación actual y crear un duplicado

Si duplicas el trabajo de replicación para añadir las tablas, ten en cuenta lo siguiente:

  • Si habilitas la instantánea para el trabajo duplicado, se cargará el historial de todas las tablas desde cero. Esta opción se recomienda si no puedes usar la opción anterior, en la que ejecutas trabajos independientes.

  • Si inhabilitas la instantánea para evitar la carga del historial, se pueden perder datos, ya que podría haber eventos que no se registren entre el momento en que se detiene la antigua canalización y el momento en que se inicia la nueva. No se recomienda crear una superposición para mitigar este problema, ya que también puede provocar la pérdida de datos (el historial de datos de las nuevas tablas no se replica).

Para crear un trabajo de replicación duplicado, sigue estos pasos:

  1. Detén el flujo de procesamiento.

  2. En la página Trabajos de replicación, busca el trabajo que quieras duplicar, haz clic en y, a continuación, en Duplicar.

  3. Habilita la captura:

    1. Vaya a Configurar fuente.
    2. En el campo Replicar datos actuales, selecciona .
  4. Añada tablas en la ventana Seleccionar tablas y transformaciones y siga el asistente para implementar la canalización de replicación.

Siguientes pasos