Controles de simultaneidad de transmisiones

En esta página, se proporciona una descripción general de los controles de simultaneidad de flujos, como la cantidad máxima de tareas simultáneas de captura de datos modificados (CDC) y tareas de reabastecimiento. Puedes controlar el rendimiento de la transmisión aumentando o disminuyendo los valores de estos parámetros.

Descripción general de los controles de simultaneidad

Con los controles de simultaneidad, puedes lograr un reabastecimiento y un CDC más rápidos, o bien equilibrar la carga en la base de datos de origen. Si necesitas una mayor capacidad de procesamiento y puedes permitirte una carga más alta en la base de datos, puedes aumentar la simultaneidad de las tareas de CDC y reabastecimiento. Por el contrario, si tu base de datos experimenta una carga alta y deseas protegerla de la sobrecarga, puedes reducir los valores de estos parámetros.

Cantidad máxima de tareas de CDC

El parámetro maxConcurrentCdcTasks te permite controlar la cantidad de tareas de CDC que ejecuta un flujo en paralelo. Para extender el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.

Entre las características clave del parámetro, se incluyen las siguientes:

  • El valor predeterminado es 5. Puedes establecer este parámetro en cualquier valor entre 1 y 50 inclusive.
  • El parámetro solo se aplica a las fuentes de Oracle y MySQL.
  • El parámetro tiene impacto solo si hay más archivos de registro de la base de datos disponibles para leer que tareas de CDC. Los parámetros de configuración de la base de datos de origen controlan la configuración de los archivos de registro: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información sobre estos parámetros, consulta la documentación de Oracle y MySQL.
  • Si disminuyes la cantidad de tareas de CDC simultáneas, es posible que Datastream se retrase con respecto a los registros de la base de datos, lo que podría provocar la pérdida de la posición del registro y la falla de la transmisión.

Cantidad máxima de tareas de reabastecimiento

El parámetro maxConcurrentBackfillTasks te permite controlar la cantidad de tareas de reabastecimiento que puede ejecutar un flujo en paralelo. Puedes aumentar o disminuir este valor para controlar la capacidad de procesamiento de reabastecimiento.

Entre las características clave del parámetro, se incluyen las siguientes:

  • El valor predeterminado es 15. Puedes establecer este parámetro en cualquier valor entre 1 y 50 inclusive.
  • Existe un alto riesgo asociado con el aumento de la simultaneidad del reabastecimiento, ya que las tareas de reabastecimiento tienen un impacto significativo en el rendimiento de la base de datos. Cada tarea de reabastecimiento ejecuta una consulta SELECT sin filtrar en una tabla y, en el caso de las tablas grandes, esas consultas muestran una gran cantidad de filas.
  • Si disminuyes la simultaneidad del reabastecimiento, no tendrá un impacto negativo en la base de datos de origen, excepto que el reabastecimiento tardará más tiempo en completarse.

Cambia los valores de los controles de simultaneidad

Puedes cambiar los valores de los parámetros de control de simultaneidad con la API de Datastream.

¿Qué sigue?