Esta página descreve como ativar o isolamento de transações nos snapshots do banco de dados do Microsoft SQL Server e do MySQL em trabalhos de replicação do Cloud Data Fusion.
Quando você configura um job de replicação para um banco de dados, o job leva uma snapshot inicial das tabelas de origem. Para garantir a consistência dos dados, coloque bloqueios nessas tabelas.
Após o snapshot inicial, as mudanças incrementais na origem são capturadas e aplicada ao destino do BigQuery como parte da replicação contínua de desenvolvimento de software.
SQL Server
Para capturar mudanças nas tabelas de origem em um banco de dados do SQL Server, o
job de replicação usa um conector Debezium. Durante o
snapshotting
,
O Debezium adquire bloqueios de acordo com o
snapshot.isolation.mode
A tabela a seguir compara os modos de isolamento compatíveis para jobs de replicação.
Modo de isolamento | Bloqueios adquiridos | Consistência de dados |
---|---|---|
read_uncommitted |
Nenhum | Não. |
read_committed |
Travamentos compartilhados em um lote de linhas por vez | Parcial. Um registro adicionado pode aparecer duas vezes: uma vez no e uma vez na fase de streaming. |
repeatable_read (padrão) |
Bloqueios compartilhados em todas as linhas | Parcial. Um registro adicionado pode aparecer duas vezes: uma no snapshot inicial e outra na fase de streaming. |
snapshot |
Nenhum | Completo. |
exclusive |
Bloqueio exclusivo em todas as tabelas | Completo. |
Para mais informações sobre os modos de isolamento, consulte Definir o nível de isolamento da transação.
Por padrão, o modo de isolamento de snapshot é repeatable_read
. Esse modo leva
de bloqueios compartilhados em todos os dados lidos durante a fase de criação de snapshots. Ele
impede que outras transações modifiquem as linhas atuais e pode
permitir a inserção de novos registros (consulte
escalonamento de bloqueio).
É recomendável fazer a replicação com isolamento de snapshots se o recurso já estiver ativado no ao banco de dados de origem porque ele fornece consistência total dos dados sem bloquear nas tabelas. Se não estiver ativado, saiba mais sobre o impacto dos níveis de isolamento com base no controle de versão de linha no SQL Server Database Engine antes de ativar.
Como alternativa, use o modo de isolamento read_committed
, que
não bloqueia as tabelas durante a fase de criação de snapshots.
Ativar o isolamento de snapshots em um job de replicação
Ative o isolamento de snapshots no banco de dados do SQL Server:
ALTER DATABASE DATABASE_NAME SET ALLOW_SNAPSHOT_ISOLATION ON
Substitua
DATABASE_NAME
pelo nome do banco de dados do SQL Server.Defina o argumento do ambiente de execução
snapshot.isolation.mode
comosnapshot
. Para mais informações, consulte Transmita um argumento de ambiente de execução para um job de replicação.
MySQL
Para capturar mudanças nas tabelas de origem em um banco de dados MySQL, o job de replicação usa um conector do Debezium. Durante o
snapshotting
,
O Debezium adquire bloqueios de acordo com o
snapshot.locking.mode
Por padrão, o modo de bloqueio de snapshots é minimal
. Nesse modo, o
O conector mantém o bloqueio de leitura global para a parte inicial do snapshot
enquanto lê os esquemas do banco de dados e outros metadados. Em seguida, o conector
busca todas as linhas por uma leitura consistente, usando a transação REPEATABLE READ
,
que não bloqueia as tabelas.
Para evitar bloqueios, defina o modo como none
.
Como alternativa, para evitar bloqueios nos bancos de dados MySQL em execução no Cloud SQL, replique o código Réplica em vez do banco de dados transacional.
Alterar o comportamento de bloqueio durante o snapshot para MySQL
- Para alterar o comportamento de bloqueio de snapshots no banco de dados MySQL, defina o ambiente de execução
a propriedade
snapshot.locking.mode
a um argumento apropriado modo de bloqueio.
Para mais informações, consulte Transmitir um argumento do Debezium para um job de replicação.
Limitações
- A replicação no Cloud Data Fusion é compatível com a versão 1.3 do Debezium Connector.
Origens do Oracle no Cloud Data Fusion
A replicação de origens do Oracle no Cloud Data Fusion é feita pelo Datastream. O Datastream não bloqueia tabelas.
A seguir
- Saiba mais sobre replicação.