Livelli di isolamento nella replica

Questa pagina descrive come abilitare l'isolamento delle transazioni negli snapshot dei database Microsoft SQL Server e MySQL nei job di replica di Cloud Data Fusion.

Quando configuri un job di replica per un database, il job acquisisce uno snapshot iniziale delle tabelle di origine. Per garantire la coerenza dei dati, imposta blocchi in queste tabelle.

Dopo lo snapshot iniziale, le modifiche incrementali nell'origine vengono acquisite e applicate alla destinazione BigQuery come parte del processo di replica in corso.

SQL Server

Per acquisire le modifiche nelle tabelle di origine in un database SQL Server, il job di replica utilizza un connettore Debezium. Durante la fase snapshotting, Debezium acquisisce i blocchi in base alla snapshot.isolation.mode configurata.

La tabella seguente mette a confronto le modalità di isolamento supportate per i job di replica.

Modalità di isolamento Serrature acquisite Coerenza dei dati
read_uncommitted Nessuna esperienza N.
read_committed Blocchi condivisi su un gruppo di righe alla volta Parziale. Un record aggiunto può apparire due volte: una volta nello snapshot iniziale e una volta nella fase di inserimento dei flussi.
repeatable_read
(valore predefinito)
Blocchi condivisi su tutte le righe Parziale. Un record aggiunto può apparire due volte: una volta nello snapshot iniziale e una volta nella fase di inserimento dei flussi.
snapshot Nessuna esperienza Piena.
exclusive Blocco esclusivo su tutte le tabelle Piena.

Per ulteriori informazioni sulle modalità di isolamento, consulta Impostare il livello di isolamento delle transazioni.

Per impostazione predefinita, la modalità di isolamento degli snapshot è repeatable_read. Questa modalità applica blocchi condivisi su tutti i dati letti durante la fase di creazione di snapshot. Impedisce ad altre transazioni di modificare le righe esistenti e può potenzialmente consentire l'inserimento di nuovi record (vedi Riassegnazione blocco).

La replica con isolamento degli snapshot è consigliata se è già abilitata nel database di origine perché fornisce la coerenza completa dei dati senza bloccare le tabelle. Se non è abilitato, scopri di più sull'impatto dei livelli di isolamento basati sul controllo delle versioni delle righe nel motore di database SQL Server prima di abilitarlo.

In alternativa, utilizza la modalità di isolamento read_committed, che non blocca le tabelle durante la fase di creazione di snapshot.

Abilita l'isolamento degli snapshot in un job di replica

  1. Abilita l'isolamento degli snapshot nel database SQL Server:

    ALTER DATABASE DATABASE_NAME
    SET ALLOW_SNAPSHOT_ISOLATION ON
    

    Sostituisci DATABASE_NAME con il nome del database SQL Server.

  2. Imposta l'argomento di runtime snapshot.isolation.mode su snapshot. Per ulteriori informazioni, consulta Passare un argomento di runtime a un job di replica.

MySQL

Per acquisire le modifiche nelle tabelle di origine in un database MySQL, il job di replica utilizza un connettore Debezium. Durante la fase snapshotting, Debezium acquisisce i blocchi in base alla snapshot.locking.mode configurata.

Per impostazione predefinita, la modalità di blocco degli snapshot è minimal. In questa modalità, il connettore contiene il blocco di lettura globale per la parte iniziale dello snapshot mentre legge gli schemi del database e altri metadati. A questo punto, il connettore recupera tutte le righe tramite una lettura coerente, utilizzando la transazione REPEATABLE READ, che non blocca le tabelle.

Per evitare blocchi, imposta la modalità su none.

In alternativa, per evitare blocchi sui database MySQL in esecuzione su Cloud SQL, esegui la replica dal database di Replica anziché dal database transazionale.

Modifica il comportamento di blocco durante lo snapshot per MySQL

  • Per modificare il comportamento di blocco degli snapshot nel database MySQL, imposta l'argomento di runtime, la proprietà snapshot.locking.mode, su un valore di modalità di blocco appropriato.

Per ulteriori informazioni, vedi Passare un argomento Debezium a un job di replica.

Limitazioni

  • La replica in Cloud Data Fusion supporta il connettore Debezium versione 1.3.

Origini Oracle in Cloud Data Fusion

La replica da origini Oracle in Cloud Data Fusion si basa su Datastream. Datastream non blocca le tabelle.

Passaggi successivi