Agrega tablas a un trabajo de replicación

Después de implementar un trabajo de replicación, no puedes editar ni agregar tablas a él. En su lugar, agrega las tablas a un trabajo de replicación nuevo o duplicado.

Opción 1: Crea un nuevo trabajo de replicación

El enfoque más sencillo es agregar tablas a un trabajo nuevo. Evitan que la información histórica volver a cargar todas las tablas y evitar problemas de incoherencia de datos.

Las desventajas son el aumento de la sobrecarga de administrar varios trabajos de replicación y el consumo de más recursos de procesamiento, ya que cada trabajo se ejecuta en un clúster efímero de Dataproc independiente de forma predeterminada. Esto último se puede mitigar hasta cierto punto usando un modelo de clúster de Dataproc para ambos trabajos.

Para obtener más información sobre la creación de nuevos trabajos, consulta la Instructivos de replicación.

Para obtener más información sobre el uso de clústeres estáticos de Dataproc en Cloud Data Fusion, consulta Ejecuta una canalización en un clúster existente de Dataproc

Opción 2: Detén el trabajo de replicación actual y crea un duplicado

Si duplicas el trabajo de replicación para agregar las tablas, considera las lo siguiente:

  • Si habilitas la instantánea para el trabajo duplicado, se cargará el historial de todas las tablas desde cero. Se recomienda esta opción si no puedes usar opción anterior, en la que ejecutas trabajos separados.

  • Inhabilitar la instantánea para evitar la carga histórica puede generar datos de pérdida de datos, ya que podría haber eventos omitidos entre el momento en que se detiene la canalización anterior y comienza el nuevo. No se recomienda crear una superposición para mitigar este problema, ya que también puede provocar la pérdida de datos, ya que no se replican los datos históricos de las tablas nuevas.

Para crear una tarea de replicación duplicada, sigue estos pasos:

  1. Detén la canalización existente.

  2. En la página de trabajos de replicación, ubica el trabajo que deseas duplicar. haz clic en y Duplicar.

  3. Habilita la instantánea:

    1. Ve a Configurar fuente.
    2. En el campo Replicar datos existentes, selecciona .
  4. Agrega tablas en la ventana Select tables and transformations y sigue el asistente para implementar la canalización de replicación.

¿Qué sigue?