En esta página se ofrece una descripción general de los controles de simultaneidad de las secuencias, como el número máximo de tareas de captura de datos de cambios (CDC) y de reposición simultáneas. Puedes controlar el rendimiento de la emisión aumentando o disminuyendo los valores de estos parámetros.
Información general sobre los controles de simultaneidad
Con los controles de simultaneidad, puedes conseguir un relleno inicial y un CDC más rápidos o equilibrar la carga en la base de datos de origen. Si necesitas un mayor rendimiento y puedes permitirte una mayor carga en la base de datos, puedes aumentar la simultaneidad de las tareas de CDC y de relleno. Por el contrario, si tu base de datos tiene una carga elevada y quieres protegerla para que no se sobrecargue, puedes reducir los valores de estos parámetros.
Número máximo de tareas de CDC
El parámetro maxConcurrentCdcTasks
le permite controlar el número de tareas de CDC que ejecuta una secuencia en paralelo. Para aumentar el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.
Entre las características clave del parámetro se incluyen las siguientes:
- El valor predeterminado es
5
. Puede asignar a este parámetro cualquier valor entre1
y50
, ambos inclusive. - El parámetro solo se aplica a las fuentes de Oracle y MySQL.
- El parámetro solo tiene efecto si hay más archivos de registro de la base de datos disponibles para leer que tareas de CDC. Los ajustes de los archivos de registro se controlan mediante los parámetros de configuración de la base de datos de origen: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información sobre estos parámetros, consulta la documentación de Oracle y MySQL.
- Si reduces el número de tareas de CDC simultáneas, es posible que Datastream se retrase con respecto a los registros de la base de datos, lo que podría provocar una pérdida de la posición del registro y un fallo en el flujo.
Número máximo de tareas de relleno
El parámetro maxConcurrentBackfillTasks
te permite controlar el número de tareas de relleno que puede ejecutar una secuencia en paralelo. Puede aumentar o reducir este valor para controlar el rendimiento del relleno.
Entre las características clave del parámetro se incluyen las siguientes:
- El valor predeterminado es
15
. Puede asignar a este parámetro cualquier valor entre1
y50
, ambos inclusive. - Aumentar la simultaneidad del relleno tiene un riesgo alto, ya que las tareas de relleno tienen un impacto significativo en el rendimiento de la base de datos.
Cada tarea de relleno ejecuta una consulta
SELECT
sin filtrar en una tabla y, en el caso de las tablas grandes, estas consultas devuelven un gran número de filas. - Si disminuye la simultaneidad de la carga inicial, no tendrá ningún impacto negativo en la base de datos de origen, excepto que la carga inicial tardará más en completarse.
Cambiar los valores de los controles de simultaneidad
Puedes cambiar los valores de los parámetros de control de simultaneidad mediante la API Datastream.
- Para saber cómo aumentar o disminuir el número de tareas de CDC simultáneas, consulta Cambiar el número máximo de tareas de CDC simultáneas.
- Para saber cómo aumentar o reducir el número de tareas de relleno simultáneas, consulte Cambiar el número máximo de tareas de relleno simultáneas.
Siguientes pasos
- Consulta el artículo sobre gestionar flujos para obtener más información sobre cómo usar la API DataStream.
- Consulta la documentación de referencia de la API Datastream para obtener más información sobre el recurso
Stream
.