Questa pagina descrive come abilitare l'isolamento delle transazioni negli snapshot dei database Microsoft SQL Server e MySQL nei job di replica di Cloud Data Fusion.
Quando configuri un job di replica per un database, il job acquisisce uno snapshot iniziale delle tabelle di origine. Per garantire la coerenza dei dati, imposta blocchi in queste tabelle.
Dopo lo snapshot iniziale, le modifiche incrementali nell'origine vengono acquisite e applicate alla destinazione BigQuery come parte del processo di replica in corso.
SQL Server
Per acquisire le modifiche nelle tabelle di origine in un database SQL Server, il job di replica utilizza un connettore Debezium. Durante la fase snapshotting
, Debezium acquisisce i blocchi in base alla snapshot.isolation.mode
configurata.
La tabella seguente mette a confronto le modalità di isolamento supportate per i job di replica.
Modalità di isolamento | Serrature acquisite | Coerenza dei dati |
---|---|---|
read_uncommitted |
Nessuna esperienza | N. |
read_committed |
Blocchi condivisi su un gruppo di righe alla volta | Parziale. Un record aggiunto può apparire due volte: una volta nello snapshot iniziale e una volta nella fase di inserimento dei flussi. |
repeatable_read (valore predefinito) |
Blocchi condivisi su tutte le righe | Parziale. Un record aggiunto può apparire due volte: una volta nello snapshot iniziale e una volta nella fase di inserimento dei flussi. |
snapshot |
Nessuna esperienza | Piena. |
exclusive |
Blocco esclusivo su tutte le tabelle | Piena. |
Per ulteriori informazioni sulle modalità di isolamento, consulta Impostare il livello di isolamento delle transazioni.
Per impostazione predefinita, la modalità di isolamento degli snapshot è repeatable_read
. Questa modalità applica blocchi condivisi su tutti i dati letti durante la fase di creazione di snapshot. Impedisce ad altre transazioni di modificare le righe esistenti e può potenzialmente consentire l'inserimento di nuovi record (vedi Riassegnazione blocco).
La replica con isolamento degli snapshot è consigliata se è già abilitata nel database di origine perché fornisce la coerenza completa dei dati senza bloccare le tabelle. Se non è abilitato, scopri di più sull'impatto dei livelli di isolamento basati sul controllo delle versioni delle righe nel motore di database SQL Server prima di abilitarlo.
In alternativa, utilizza la modalità di isolamento read_committed
, che
non blocca le tabelle durante la fase di creazione di snapshot.
Abilita l'isolamento degli snapshot in un job di replica
Abilita l'isolamento degli snapshot nel database SQL Server:
ALTER DATABASE DATABASE_NAME SET ALLOW_SNAPSHOT_ISOLATION ON
Sostituisci
DATABASE_NAME
con il nome del database SQL Server.Imposta l'argomento di runtime
snapshot.isolation.mode
susnapshot
. Per ulteriori informazioni, consulta Passare un argomento di runtime a un job di replica.
MySQL
Per acquisire le modifiche nelle tabelle di origine in un database MySQL, il job di replica utilizza un connettore Debezium. Durante la fase snapshotting
, Debezium acquisisce i blocchi in base alla snapshot.locking.mode
configurata.
Per impostazione predefinita, la modalità di blocco degli snapshot è minimal
. In questa modalità, il connettore contiene il blocco di lettura globale per la parte iniziale dello snapshot mentre legge gli schemi del database e altri metadati. A questo punto, il connettore recupera tutte le righe tramite una lettura coerente, utilizzando la transazione REPEATABLE READ
, che non blocca le tabelle.
Per evitare blocchi, imposta la modalità su none
.
In alternativa, per evitare blocchi sui database MySQL in esecuzione su Cloud SQL, esegui la replica dal database di Replica anziché dal database transazionale.
Modifica il comportamento di blocco durante lo snapshot per MySQL
- Per modificare il comportamento di blocco degli snapshot nel database MySQL, imposta l'argomento di runtime, la proprietà
snapshot.locking.mode
, su un valore di modalità di blocco appropriato.
Per ulteriori informazioni, vedi Passare un argomento Debezium a un job di replica.
Limitazioni
- La replica in Cloud Data Fusion supporta il connettore Debezium versione 1.3.
Origini Oracle in Cloud Data Fusion
La replica da origini Oracle in Cloud Data Fusion si basa su Datastream. Datastream non blocca le tabelle.
Passaggi successivi
- Scopri di più sulla Replica.