Aggiungere tabelle a un job di replica

Dopo aver eseguito il deployment di un job di replica, non puoi modificare né aggiungere tabelle li annotino. Aggiungi invece le tabelle a un nuovo job di replica o a un job duplicato.

Opzione 1: crea un nuovo job di replica

L'aggiunta di tabelle a un nuovo job è l'approccio più semplice. Impedisce il reloading storico di tutte le tabelle e i problemi di incoerenza dei dati.

Gli svantaggi sono l'aumento del sovraccarico della gestione di più job di replica e il consumo di più risorse di calcolo, poiché ogni job viene eseguito su un cluster Dataproc temporaneo separato per impostazione predefinita. Quest'ultimo può essere mitigato in una certa misura utilizzando un Cluster Dataproc per entrambi i job.

Per ulteriori informazioni sulla creazione di nuovi lavori, consulta Tutorial sulla replica.

Per ulteriori informazioni sull'utilizzo del cluster Dataproc statico in Cloud Data Fusion, consulta Eseguire una pipeline in un cluster Dataproc esistente

Opzione 2: arresta il job di replica corrente e crea un duplicato

Se duplichi il job di replica per aggiungere le tabelle, tieni presente quanto segue:

  • L'abilitazione dello snapshot per il job duplicato genera il caricamento storico di tutte le tabelle da zero. Questa opzione è consigliata se non puoi utilizzare l'opzione precedente, in cui esegui job separati.

  • La disabilitazione dello snapshot per impedire il caricamento storico può generare dati poiché potrebbero verificarsi eventi persi tra il momento in cui si interrompe la pipeline precedente e quello nuovo inizia. La creazione di una sovrapposizione per limitare il problema non è consigliato, in quanto può anche causare una perdita di dati, ossia i dati storici tabelle non vengono replicate.

Per creare un job di replica duplicato:

  1. Interrompi la pipeline esistente.

  2. Nella pagina Job di replica, individua il job da duplicare, fai clic su e Duplica.

  3. Attiva lo snapshot:

    1. Vai a Configura origine.
    2. Nel campo Replica i dati esistenti, seleziona .
  4. Aggiungi le tabelle nella finestra Seleziona tabelle e trasformazioni e segui la procedura guidata per eseguire il deployment della pipeline di replica.

Passaggi successivi