En esta página, se proporciona una descripción general de los controles de simultaneidad de flujos, como la cantidad máxima de tareas simultáneas de captura de datos modificados (CDC) y tareas de reabastecimiento. Puedes controlar el rendimiento de la transmisión aumentando o disminuyendo los valores de estos parámetros.
Descripción general de los controles de simultaneidad
Con los controles de simultaneidad, puedes lograr un reabastecimiento y un CDC más rápidos, o bien equilibrar la carga en la base de datos de origen. Si necesitas una mayor capacidad de procesamiento y puedes permitirte una carga más alta en la base de datos, puedes aumentar la simultaneidad de las tareas de CDC y reabastecimiento. Por el contrario, si tu base de datos experimenta una carga alta y deseas protegerla de la sobrecarga, puedes reducir los valores de estos parámetros.
Cantidad máxima de tareas de CDC
El parámetro maxConcurrentCdcTasks
te permite controlar la cantidad de tareas de CDC que ejecuta un flujo en paralelo. Para extender el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.
Entre las características clave del parámetro, se incluyen las siguientes:
- El valor predeterminado es
5
. Puedes establecer este parámetro en cualquier valor entre1
y50
inclusive. - El parámetro solo se aplica a las fuentes de Oracle y MySQL.
- El parámetro tiene impacto solo si hay más archivos de registro de la base de datos disponibles para leer que tareas de CDC. Los parámetros de configuración de la base de datos de origen controlan la configuración de los archivos de registro: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información sobre estos parámetros, consulta la documentación de Oracle y MySQL.
- Si disminuyes la cantidad de tareas de CDC simultáneas, es posible que Datastream se retrase con respecto a los registros de la base de datos, lo que podría provocar la pérdida de la posición del registro y la falla de la transmisión.
Cantidad máxima de tareas de reabastecimiento
El parámetro maxConcurrentBackfillTasks
te permite controlar la cantidad de tareas de reabastecimiento que puede ejecutar un flujo en paralelo. Puedes aumentar o disminuir este valor para controlar la capacidad de procesamiento de reabastecimiento.
Entre las características clave del parámetro, se incluyen las siguientes:
- El valor predeterminado es
15
. Puedes establecer este parámetro en cualquier valor entre1
y50
inclusive. - Existe un alto riesgo asociado con el aumento de la simultaneidad del reabastecimiento, ya que las tareas de reabastecimiento tienen un impacto significativo en el rendimiento de la base de datos.
Cada tarea de reabastecimiento ejecuta una consulta
SELECT
sin filtrar en una tabla y, en el caso de las tablas grandes, esas consultas muestran una gran cantidad de filas. - Si disminuyes la simultaneidad del reabastecimiento, no tendrá un impacto negativo en la base de datos de origen, excepto que el reabastecimiento tardará más tiempo en completarse.
Cambia los valores de los controles de simultaneidad
Puedes cambiar los valores de los parámetros de control de simultaneidad con la API de Datastream.
- Para obtener información sobre cómo aumentar o disminuir la cantidad de tareas de CDC simultáneas, consulta Cómo cambiar la cantidad máxima de tareas de CDC simultáneas.
- Para obtener información sobre cómo aumentar o disminuir la cantidad de tareas de reabastecimiento simultáneas, consulta Cómo cambiar la cantidad máxima de tareas de reabastecimiento simultáneas.
¿Qué sigue?
- Consulta Cómo administrar transmisiones para obtener más información sobre el uso de la API de Datastream.
- Consulta la documentación de referencia de la API de Datastream para obtener más información sobre el recurso
Stream
.