Esta página oferece uma vista geral dos controlos de simultaneidade de streams, como o número máximo de tarefas de captura de dados de alterações (CDC) e tarefas de preenchimento. Pode controlar o desempenho do fluxo aumentando ou diminuindo os valores destes parâmetros.
Vista geral dos controlos de simultaneidade
Ao usar os controlos de simultaneidade, pode conseguir um preenchimento alternativo e uma CDC mais rápidos ou equilibrar a carga na base de dados de origem. Se precisar de taxas de débito mais elevadas e puder suportar uma carga mais elevada na base de dados, pode aumentar a simultaneidade das tarefas de CDC e preenchimento. Por outro lado, se a sua base de dados estiver a registar uma carga elevada e quiser protegê-la contra sobrecargas, pode reduzir os valores destes parâmetros.
Número máximo de tarefas de CDC
O parâmetro maxConcurrentCdcTasks
permite-lhe controlar o número de tarefas de CDC que uma stream executa em paralelo. Para aumentar o débito da CDC, aumente o valor deste parâmetro e permita que o Datastream processe mais ficheiros de registo da CDC em simultâneo.
As principais caraterísticas do parâmetro incluem:
- O valor predefinido é
5
. Pode definir este parâmetro para qualquer valor entre1
e50
, inclusive. - O parâmetro só é aplicável a origens Oracle e MySQL.
- O parâmetro só tem impacto se existirem mais ficheiros de registo da base de dados disponíveis para leitura do que tarefas de CDC. As definições dos ficheiros de registo são controladas pelos parâmetros de configuração da base de dados de origem: o tamanho máximo do ficheiro de registo e o intervalo de tempo máximo de rotação do registo. Para mais informações sobre estes parâmetros, consulte a documentação da Oracle e do MySQL.
- Se diminuir o número de tarefas de CDC simultâneas, o Datastream pode ficar atrasado em relação aos registos da base de dados, o que pode levar à perda da posição do registo e à falha da stream.
Número máximo de tarefas de repreenchimento
O parâmetro maxConcurrentBackfillTasks
permite-lhe controlar o número de tarefas de preenchimento
que uma stream pode executar em paralelo. Pode aumentar ou diminuir este valor
para controlar o débito do preenchimento.
As principais caraterísticas do parâmetro incluem:
- O valor predefinido é
15
. Pode definir este parâmetro para qualquer valor entre1
e50
, inclusive. - Existe um risco elevado associado ao aumento da simultaneidade do preenchimento,
porque as tarefas de preenchimento têm um impacto significativo no desempenho da base de dados.
Cada tarefa de preenchimento executa uma consulta
SELECT
não filtrada numa tabela e, para tabelas grandes, essas consultas devolvem um grande número de linhas. - Se diminuir a simultaneidade do preenchimento, não tem um impacto negativo na base de dados de origem, exceto no facto de o preenchimento demorar mais tempo a ser concluído.
Altere os valores dos controlos de concorrência
Pode alterar os valores dos parâmetros de controlo de concorrência através da API Datastream.
- Para saber como aumentar ou diminuir o número de tarefas de CDC simultâneas, consulte o artigo Altere o número máximo de tarefas de CDC simultâneas.
- Para saber como aumentar ou diminuir o número de tarefas de repreenchimento simultâneas, consulte o artigo Altere o número máximo de tarefas de repreenchimento simultâneas
O que se segue?
- Consulte o artigo sobre a gestão de streams para saber mais sobre como usar a API Datastream.
- Consulte a documentação de referência da API Datastream
para saber mais sobre o recurso
Stream
.