Controles de simultaneidad de transmisiones

En esta página, se proporciona una descripción general de los controles de simultaneidad de flujos, como la cantidad máxima de tareas simultáneas de captura de datos de cambios (CDC) y tareas de reabastecimiento. Puedes controlar el rendimiento de la transmisión aumentando o disminuyendo los valores de estos parámetros.

Descripción general de los controles de simultaneidad

Con los controles de simultaneidad, puedes lograr un reabastecimiento y un CDC más rápidos, o bien equilibrar la carga en la base de datos de origen. Si necesitas capacidades de procesamiento más altas, y puedes permitir una mayor carga en la base de datos, puedes aumentar la simultaneidad de CDC y tareas de reabastecimiento. Por el contrario, si tu base de datos experimenta un alto y quieres protegerla de una sobrecarga, puedes reducir el de estos parámetros.

Cantidad máxima de tareas de CDC

El parámetro maxConcurrentCdcTasks te permite controlar la cantidad de CDC tareas que una transmisión ejecuta en paralelo. Para extender el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.

Las características clave del parámetro incluyen lo siguiente:

  • El valor predeterminado es 5. Puedes establecer este parámetro en cualquier valor entre 1 y 50 inclusive.
  • El parámetro solo se aplica a las fuentes de Oracle y MySQL.
  • El parámetro solo tiene impacto si hay más archivos de registro de la base de datos disponibles que leer que las tareas de CDC. La configuración de los archivos de registro se controla los parámetros de configuración de la base de datos de origen: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información consulta la documentación de Oracle y MySQL.
  • Si disminuyes la cantidad de tareas de CDC simultáneas, es posible que Datastream retraso con respecto a los registros de la base de datos, lo que, con el tiempo, puede llevar a la pérdida de posición en los registros y fallas de transmisión.

Cantidad máxima de tareas de reabastecimiento

El parámetro maxConcurrentBackfillTasks te permite controlar la cantidad de reabastecimiento tareas que una transmisión puede ejecutar en paralelo. Puedes aumentar o disminuir este valor para controlar la capacidad de procesamiento de reabastecimiento.

Entre las características clave del parámetro, se incluyen las siguientes:

  • El valor predeterminado es 15. Puedes establecer este parámetro en cualquier valor entre 1 y 50 inclusive.
  • Existe un alto riesgo asociado con el aumento de la simultaneidad de reabastecimiento porque las tareas de reabastecimiento tienen un impacto significativo en el rendimiento de la base de datos. Cada tarea de reabastecimiento ejecuta una consulta SELECT sin filtrar en una tabla y, en el caso de las tablas grandes, esas consultas muestran una gran cantidad de filas.
  • Si disminuyes la simultaneidad de reabastecimiento, no tendrá un impacto negativo en el de la base de datos de origen, excepto porque el reabastecimiento tarda más en completarse.

Cambia los valores de los controles de simultaneidad

Puedes cambiar los valores de los parámetros de control de simultaneidad con el API de Datastream.

¿Qué sigue?