Controles de simultaneidade do stream

Esta página oferece uma visão geral dos controles de simultaneidade de fluxo, como o número máximo de tarefas simultâneas de captura de dados alterados (CDC, na sigla em inglês) e de preenchimento. É possível controlar a performance do stream aumentando ou diminuindo os valores desses parâmetros.

Informações gerais sobre os controles de simultaneidade

Ao usar os controles de simultaneidade, você pode conseguir um preenchimento e um CDC mais rápidos ou equilibrar a carga no banco de dados de origem. Se você precisar de maior capacidade de processamento e puder arcar com uma carga maior no banco de dados, aumente a simultaneidade do CDC e das tarefas de preenchimento. Por outro lado, se o banco de dados estiver com uma carga alta e você quiser evitar a sobrecarga, reduza os valores desses parâmetros.

Número máximo de tarefas de CDC

O parâmetro maxConcurrentCdcTasks permite controlar o número de tarefas do CDC que um fluxo executa em paralelo. Para aumentar a capacidade de processamento do CDC, aumente o valor desse parâmetro e permita que o Datastream processe mais arquivos de registro do CDC ao mesmo tempo.

As principais características do parâmetro incluem:

  • O valor padrão é 5. É possível definir esse parâmetro como qualquer valor entre 1 e 50.
  • O parâmetro é aplicável apenas às origens do Oracle e do MySQL.
  • O parâmetro só tem impacto se houver mais arquivos de registro do banco de dados disponíveis para leitura do que tarefas do CDC. As configurações dos arquivos de registro são controladas pelos parâmetros de configuração do banco de dados de origem: o tamanho máximo do arquivo de registro e o intervalo máximo de tempo de rotação de registro. Para mais informações sobre esses parâmetros, consulte a documentação do Oracle e do MySQL.
  • Se você diminuir o número de tarefas de CDC simultâneas, o Datastream poderá ficar atrás dos registros do banco de dados, o que pode levar à perda da posição do registro e à falha da transmissão.

Número máximo de tarefas de preenchimento

O parâmetro maxConcurrentBackfillTasks permite controlar o número de tarefas de preenchimento que um fluxo pode executar em paralelo. É possível aumentar ou diminuir esse valor para controlar a capacidade de processamento de backfill.

As principais características do parâmetro incluem:

  • O valor padrão é 15. É possível definir esse parâmetro como qualquer valor entre 1 e 50.
  • Há um alto risco associado ao aumento da simultaneidade de preenchimento, porque as tarefas de preenchimento têm um impacto significativo no desempenho do banco de dados. Cada tarefa de preenchimento executa uma consulta SELECT não filtrada em uma tabela. Em tabelas grandes, essas consultas retornam um grande número de linhas.
  • Se você diminuir a simultaneidade de preenchimento, isso não terá impacto negativo no banco de dados de origem, exceto pelo tempo de preenchimento mais longo.

Mudar os valores dos controles de simultaneidade

É possível mudar os valores dos parâmetros de controle de simultaneidade usando a API Datastream.

A seguir