Controles de simultaneidade do stream

Nesta página, você encontra uma visão geral dos controles de simultaneidade de stream, como a número de tarefas simultâneas de captura de dados alterados (CDC) e de preenchimento. É possível controlar a performance do stream aumentando ou diminuindo os valores desses parâmetros.

Visão geral dos controles de simultaneidade

Ao usar os controles de simultaneidade, você pode conseguir um preenchimento e um CDC mais rápidos ou equilibrar a carga no banco de dados de origem. Se você precisar de maior capacidade de processamento e puder arcar com uma carga maior no banco de dados, aumente a simultaneidade do CDC e das tarefas de preenchimento. Por outro lado, se o seu banco de dados estiver passando por uma carga e quiser protegê-la contra sobrecarga, poderá reduzir a valores desses parâmetros.

Número máximo de tarefas de CDC

O parâmetro maxConcurrentCdcTasks permite controlar o número de tarefas de CDC que um stream executa em paralelo. Para ampliar a capacidade de processamento do CDC, aumente o valor desse parâmetro e permitir que o Datastream processe mais arquivos de registro do CDC ao mesmo tempo.

As principais características do parâmetro incluem:

  • O valor padrão é 5. Você pode definir esse parâmetro para qualquer valor entre 1 e 50, inclusive.
  • O parâmetro é aplicável somente a origens Oracle e MySQL.
  • O parâmetro tem impacto apenas se houver mais arquivos de registro do banco de dados disponíveis ler do que há tarefas de CDC. As configurações dos arquivos de registro são controladas os parâmetros de configuração do banco de dados de origem: o tamanho máximo do arquivo de registro e o intervalo de tempo máximo da rotação de registros. Para mais informações sobre consulte a documentação do Oracle e do MySQL.
  • Se você diminuir o número de tarefas de CDC simultâneas, o Datastream poderá atrasar os registros do banco de dados, o que pode levar à perda de posição do registro e falhas de stream.

Número máximo de tarefas de preenchimento

O parâmetro maxConcurrentBackfillTasks permite controlar o número de preenchimentos que um stream pode executar em paralelo. É possível aumentar ou diminuir esse valor para controlar a capacidade de preenchimento.

As principais características do parâmetro incluem:

  • O valor padrão é 15. Você pode definir esse parâmetro para qualquer valor entre 1 e 50, inclusive.
  • Há um alto risco associado ao aumento da simultaneidade de preenchimento, porque as tarefas de preenchimento têm um impacto significativo no desempenho do banco de dados. Cada tarefa de preenchimento executa uma consulta SELECT não filtrada em uma tabela. Para tabelas grandes, essas consultas retornam um grande número de linhas.
  • Diminuir a simultaneidade de preenchimento não tem impacto negativo sobre a banco de dados de origem, exceto porque o preenchimento leva mais tempo para ser concluído.

Alterar os valores dos controles de simultaneidade

É possível mudar os valores dos parâmetros de controle de simultaneidade usando a API Datastream.

A seguir