Controles de simultaneidad de las emisiones

En esta página se ofrece una descripción general de los controles de simultaneidad de las secuencias, como el número máximo de tareas de captura de datos de cambios (CDC) y de reposición simultáneas. Puedes controlar el rendimiento de la emisión aumentando o disminuyendo los valores de estos parámetros.

Información general sobre los controles de simultaneidad

Con los controles de simultaneidad, puedes conseguir un relleno inicial y un CDC más rápidos o equilibrar la carga en la base de datos de origen. Si necesitas un mayor rendimiento y puedes permitirte una mayor carga en la base de datos, puedes aumentar la simultaneidad de las tareas de CDC y de relleno. Por el contrario, si tu base de datos tiene una carga elevada y quieres protegerla para que no se sobrecargue, puedes reducir los valores de estos parámetros.

Número máximo de tareas de CDC

El parámetro maxConcurrentCdcTasks le permite controlar el número de tareas de CDC que ejecuta una secuencia en paralelo. Para aumentar el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.

Entre las características clave del parámetro se incluyen las siguientes:

  • El valor predeterminado es 5. Puede asignar a este parámetro cualquier valor entre 1 y 50, ambos inclusive.
  • El parámetro solo se aplica a las fuentes de Oracle y MySQL.
  • El parámetro solo tiene efecto si hay más archivos de registro de la base de datos disponibles para leer que tareas de CDC. Los ajustes de los archivos de registro se controlan mediante los parámetros de configuración de la base de datos de origen: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información sobre estos parámetros, consulta la documentación de Oracle y MySQL.
  • Si reduces el número de tareas de CDC simultáneas, es posible que Datastream se retrase con respecto a los registros de la base de datos, lo que podría provocar una pérdida de la posición del registro y un fallo en el flujo.

Número máximo de tareas de relleno

El parámetro maxConcurrentBackfillTasks te permite controlar el número de tareas de relleno que puede ejecutar una secuencia en paralelo. Puede aumentar o reducir este valor para controlar el rendimiento del relleno.

Entre las características clave del parámetro se incluyen las siguientes:

  • El valor predeterminado es 15. Puede asignar a este parámetro cualquier valor entre 1 y 50, ambos inclusive.
  • Aumentar la simultaneidad del relleno tiene un riesgo alto, ya que las tareas de relleno tienen un impacto significativo en el rendimiento de la base de datos. Cada tarea de relleno ejecuta una consulta SELECT sin filtrar en una tabla y, en el caso de las tablas grandes, estas consultas devuelven un gran número de filas.
  • Si disminuye la simultaneidad de la carga inicial, no tendrá ningún impacto negativo en la base de datos de origen, excepto que la carga inicial tardará más en completarse.

Cambiar los valores de los controles de simultaneidad

Puedes cambiar los valores de los parámetros de control de simultaneidad mediante la API Datastream.

Siguientes pasos