Nesta página, você terá uma visão geral dos controles de simultaneidade de stream, como o número máximo de tarefas simultâneas de captura de dados alterados (CDC) e de preenchimento. É possível controlar o desempenho do stream aumentando ou diminuindo os valores desses parâmetros.
Visão geral dos controles de simultaneidade
Ao usar os controles de simultaneidade, é possível conseguir preenchimento e CDC mais rápidos ou balancear a carga no banco de dados de origem. Se você precisar de capacidades mais altas e puder arcar com uma carga maior no banco de dados, aumente a simultaneidade de tarefas de CDC e de preenchimento. Por outro lado, se o banco de dados estiver com uma carga alta e você quiser protegê-lo contra sobrecarga, reduza os valores desses parâmetros.
Número máximo de tarefas do CDC
O parâmetro maxConcurrentCdcTasks
permite controlar o número de tarefas
de CDC que um stream executa em paralelo. Para estender a capacidade do CDC, aumente o
valor desse parâmetro e permita que o Datastream processe mais arquivos de registros do CDC
ao mesmo tempo.
As principais características do parâmetro incluem:
- O valor padrão é
5
. É possível definir esse parâmetro como qualquer valor entre1
e50
. - O parâmetro é aplicável somente às origens Oracle e MySQL.
- O parâmetro só terá impacto se houver mais arquivos de registros do banco de dados disponíveis para leitura do que tarefas de CDC. As definições dos arquivos de registros são controladas pelos parâmetros de configuração do banco de dados de origem: o tamanho máximo do arquivo de registros e o intervalo de tempo máximo de rotação de registros. Para mais informações sobre esses parâmetros, consulte a documentação do Oracle e do MySQL.
- Se você diminuir o número de tarefas simultâneas do CDC, o Datastream poderá atrasar os registros do banco de dados, o que poderá levar a uma perda de posição do registro e a uma falha no stream.
Número máximo de tarefas de preenchimento
O parâmetro maxConcurrentBackfillTasks
permite controlar o número de tarefas
de preenchimento que um stream pode executar em paralelo. Aumente ou diminua esse valor para controlar a capacidade de preenchimento.
As principais características do parâmetro incluem:
- O valor padrão é
15
. É possível definir esse parâmetro como qualquer valor entre1
e50
. - Há um alto risco associado ao aumento da simultaneidade de preenchimento, porque as tarefas de preenchimento têm um impacto significativo no desempenho do banco de dados.
Cada tarefa de preenchimento executa uma consulta
SELECT
não filtrada em uma tabela e, para tabelas grandes, essas consultas retornam um grande número de linhas. - Se você diminuir a simultaneidade de preenchimento, isso não terá impacto negativo no banco de dados de origem, exceto o preenchimento que leva mais tempo para ser concluído.
Alterar os valores dos controles de simultaneidade
É possível alterar os valores dos parâmetros de controle de simultaneidade usando a API Datastream.
- Para saber como aumentar ou diminuir o número de tarefas simultâneas do CDC, consulte Alterar o número de tarefas simultâneas do CDC.
- Para saber como aumentar ou diminuir o número de tarefas de preenchimento simultâneas, consulte Alterar o número máximo de tarefas de preenchimento simultâneos.
A seguir
- Consulte Como gerenciar fluxos para saber mais sobre como usar a API Datastream.
- Consulte a documentação de referência da API Datastream para saber mais sobre o recurso
Stream
.