Adicione tabelas a uma tarefa de replicação

Depois de implementar uma tarefa de replicação, não pode editar nem adicionar tabelas à mesma. Em alternativa, adicione as tabelas a uma tarefa de replicação nova ou duplicada.

Opção 1: crie uma nova tarefa de replicação

Adicionar tabelas a uma nova tarefa é a abordagem mais simples. Impede o recarregamento do histórico de todas as tabelas e evita problemas de inconsistência de dados.

As desvantagens são o aumento dos custos gerais de gestão de várias tarefas de replicação e o consumo de mais recursos de computação, uma vez que cada tarefa é executada num cluster do Dataproc efémero separado por predefinição. Este último pode ser mitigado até certo ponto através da utilização de um cluster do Dataproc estático partilhado para ambas as tarefas.

Para mais informações sobre a criação de novos trabalhos, consulte os tutoriais de replicação.

Para mais informações sobre a utilização de um cluster Dataproc estático no Cloud Data Fusion, consulte o artigo Execute um pipeline num cluster Dataproc existente

Opção 2: pare a tarefa de replicação atual e crie um duplicado

Se duplicar a tarefa de replicação para adicionar as tabelas, considere o seguinte:

  • A ativação da captura instantânea para os resultados de tarefas duplicados resulta no carregamento histórico de todas as tabelas desde o início. Esta opção é recomendada se não puder usar a opção anterior, em que executa tarefas separadas.

  • A desativação da captura instantânea para impedir o carregamento do histórico pode resultar na perda de dados, uma vez que podem existir eventos perdidos entre o momento em que o pipeline antigo para e o novo começa. A criação de uma sobreposição para mitigar este problema não é recomendada, uma vez que também pode resultar na perda de dados. Os dados do histórico das novas tabelas não são replicados.

Para criar uma tarefa de replicação duplicada, siga estes passos:

  1. Parar o pipeline existente.

  2. Na página Tarefas de replicação, localize a tarefa que quer duplicar, clique em e Duplicar.

  3. Ative o instantâneo:

    1. Aceda a Configurar origem.
    2. No campo Replicar dados existentes, selecione Sim.
  4. Adicione tabelas na janela Selecionar tabelas e transformações e siga o assistente para implementar o pipeline de replicação.

O que se segue?