Questa pagina descrive come modificare gli schemi in Cloud Data Fusion quando replichi i dati da un database Microsoft SQL Server a una tabella BigQuery. Per assicurarti che il job di replica continui a replicare i dati da un'origine SQL Server dopo la modifica dello schema, segui questi passaggi.
Modifica lo schema
Vai all'istanza:
Nella console Google Cloud, vai alla pagina di Cloud Data Fusion.
Per aprire l'istanza in Cloud Data Fusion Studio: Fai clic su Istanze e poi su Visualizza istanza.
Nell'interfaccia web di Cloud Data Fusion, fai clic su Replica.
Arresta il job di replica.
Applica una modifica dello schema supportata alla tabella di origine, ad esempio Aggiungi colonna nullable.
Crea una nuova tabella di acquisizione utilizzando la procedura
sys.sp_cdc_enable_table
con un valore univoco per il parametro@capture_instance
.Applica la stessa modifica dello schema alla tabella di destinazione in BigQuery.
Riavvia il job di replica.
(Facoltativo) Quando il job inizia a eseguire lo streaming delle nuove modifiche che si verificano dopo che lo hai interrotto, puoi eliminare la vecchia tabella di acquisizione utilizzando la procedura memorizzata
sys.sp_cdc_disable_table
. Impostare il parametro@capture_instance
al nome dell'istanza di acquisizione precedente.
Dopo aver applicato una modifica dello schema alla tabella di origine e prima di creare una nuova tabella di acquisizione (come hai fatto nei passaggi precedenti), tutte le modifiche vengono acquisite dalla vecchia acquisizione con lo schema precedente. Se hai aggiunto una colonna, qualsiasi evento di modifica durante questo periodo di tempo non contiene dati per la nuova colonna. Se la tua applicazione non è in grado di gestire una transizione di questo tipo, segui questi passaggi:
Sospendere tutte le applicazioni che generano record di database.
Assicurati che il job di replica abbia elaborato tutte le risorse esistenti eventi.
Arresta il job di replica.
Applica la modifica allo schema alla tabella di origine, ad esempio Aggiungi valori nulli .
Crea una nuova tabella di acquisizione utilizzando la procedura
sys.sp_cdc_enable_table
con un valore univoco per il parametro@capture_instance
.Riprendi le applicazioni sospese nel primo passaggio.
Applica la stessa modifica allo schema alla tabella di destinazione in BigQuery.
Riavvia il job di replica.
(Facoltativo) Quando il job avvia il flusso di nuove modifiche apportate dopo creata la nuova tabella di acquisizione nel passaggio precedente, puoi rilasciare la tabella precedente utilizzando
sys.sp_cdc_disable_table
stored procedure. Imposta il parametro@capture_instance
sul nome dell'istanza di acquisizione precedente.
Passaggi successivi
- Scopri di più sulla replica.
- Consulta le modifiche allo schema supportate.
- Consulta l'API Replication.