Esta página foi traduzida pela API Cloud Translation.

Adicionar tabelas a um job de replicação

Depois de implantar um job de replicação, não é possível editar ou adicionar tabelas a ele. Em vez disso, adicione as tabelas a um job de replicação novo ou duplicado.

Opção 1: criar um job de replicação

Adicionar tabelas a um novo job é a abordagem mais simples. Ele evita o recarregamento histórico de todas as tabelas e evita problemas de inconsistência de dados.

As desvantagens são o aumento da sobrecarga de gerenciamento de vários jobs de replicação e o consumo de mais recursos de computação, já que cada job é executado em um cluster efémero do Dataproc por padrão. O último pode ser mitigado em certa medida usando um cluster estático compartilhado do Dataproc para os dois jobs.

Para mais informações sobre a criação de novos jobs, consulte os tutoriais de replicação.

Para mais informações sobre como usar o cluster estático do Dataproc no Cloud Data Fusion, consulte Executar um pipeline em um cluster atual do Dataproc.

Opção 2: interromper o job de replicação atual e criar uma cópia

Se você duplicar o job de replicação para adicionar as tabelas, considere o seguinte:

Ativar o snapshot para o job duplicado resulta no carregamento histórico de todas as tabelas do zero. Isso é recomendado se você não puder usar a opção anterior, em que você executa jobs separados.
Desativar o snapshot para impedir a carga histórica pode resultar na perda de dados, já que podem ocorrer eventos perdidos entre o momento em que o pipeline antigo é interrompido e o novo é iniciado. Não é recomendado criar uma sobreposição para atenuar esse problema, porque isso também pode resultar na perda de dados. Os dados históricos das novas tabelas não são replicados.

Para criar um job de replicação duplicado, siga estas etapas:

Pare o pipeline atual.
Na página "Jobs de replicação", localize o job que você quer duplicar, clique em e em Duplicar.
Ative o snapshot:
1. Acesse Configurar origem.
2. No campo Replicar dados atuais, selecione Sim.
Adicione tabelas na janela Selecionar tabelas e transformações e siga o assistente para implantar o pipeline de replicação.

A seguir

Saiba mais sobre a replicação.