Controles de simultaneidade de streaming

Nesta página, você terá uma visão geral dos controles de simultaneidade de stream, como o número máximo de tarefas simultâneas de captura de dados alterados (CDC) e de preenchimento. É possível controlar o desempenho do stream aumentando ou diminuindo os valores desses parâmetros.

Visão geral dos controles de simultaneidade

Ao usar os controles de simultaneidade, é possível conseguir preenchimento e CDC mais rápidos ou balancear a carga no banco de dados de origem. Se você precisar de capacidades mais altas e puder arcar com uma carga maior no banco de dados, aumente a simultaneidade de tarefas de CDC e de preenchimento. Por outro lado, se o banco de dados estiver com uma carga alta e você quiser protegê-lo contra sobrecarga, reduza os valores desses parâmetros.

Número máximo de tarefas do CDC

O parâmetro maxConcurrentCdcTasks permite controlar o número de tarefas de CDC que um stream executa em paralelo. Para estender a capacidade do CDC, aumente o valor desse parâmetro e permita que o Datastream processe mais arquivos de registros do CDC ao mesmo tempo.

As principais características do parâmetro incluem:

  • O valor padrão é 5. É possível definir esse parâmetro como qualquer valor entre 1 e 50.
  • O parâmetro é aplicável somente às origens Oracle e MySQL.
  • O parâmetro só terá impacto se houver mais arquivos de registros do banco de dados disponíveis para leitura do que tarefas de CDC. As definições dos arquivos de registros são controladas pelos parâmetros de configuração do banco de dados de origem: o tamanho máximo do arquivo de registros e o intervalo de tempo máximo de rotação de registros. Para mais informações sobre esses parâmetros, consulte a documentação do Oracle e do MySQL.
  • Se você diminuir o número de tarefas simultâneas do CDC, o Datastream poderá atrasar os registros do banco de dados, o que poderá levar a uma perda de posição do registro e a uma falha no stream.

Número máximo de tarefas de preenchimento

O parâmetro maxConcurrentBackfillTasks permite controlar o número de tarefas de preenchimento que um stream pode executar em paralelo. Aumente ou diminua esse valor para controlar a capacidade de preenchimento.

As principais características do parâmetro incluem:

  • O valor padrão é 15. É possível definir esse parâmetro como qualquer valor entre 1 e 50.
  • Há um alto risco associado ao aumento da simultaneidade de preenchimento, porque as tarefas de preenchimento têm um impacto significativo no desempenho do banco de dados. Cada tarefa de preenchimento executa uma consulta SELECT não filtrada em uma tabela e, para tabelas grandes, essas consultas retornam um grande número de linhas.
  • Se você diminuir a simultaneidade de preenchimento, isso não terá impacto negativo no banco de dados de origem, exceto o preenchimento que leva mais tempo para ser concluído.

Alterar os valores dos controles de simultaneidade

É possível alterar os valores dos parâmetros de controle de simultaneidade usando a API Datastream.

A seguir