En esta página, se proporciona una descripción general de los controles de simultaneidad de flujos, como la cantidad máxima de tareas simultáneas de captura de datos de cambios (CDC) y tareas de reabastecimiento. Puedes controlar el rendimiento de la transmisión aumentando o disminuyendo los valores de estos parámetros.
Descripción general de los controles de simultaneidad
Con los controles de simultaneidad, puedes lograr un reabastecimiento y un CDC más rápidos, o bien equilibrar la carga en la base de datos de origen. Si necesitas capacidades de procesamiento más altas, y puedes permitir una mayor carga en la base de datos, puedes aumentar la simultaneidad de CDC y tareas de reabastecimiento. Por el contrario, si tu base de datos experimenta un alto y quieres protegerla de una sobrecarga, puedes reducir el de estos parámetros.
Cantidad máxima de tareas de CDC
El parámetro maxConcurrentCdcTasks
te permite controlar la cantidad de CDC
tareas que una transmisión ejecuta en paralelo. Para extender el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.
Las características clave del parámetro incluyen lo siguiente:
- El valor predeterminado es
5
. Puedes establecer este parámetro en cualquier valor entre1
y50
inclusive. - El parámetro solo se aplica a las fuentes de Oracle y MySQL.
- El parámetro solo tiene impacto si hay más archivos de registro de la base de datos disponibles que leer que las tareas de CDC. La configuración de los archivos de registro se controla los parámetros de configuración de la base de datos de origen: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información consulta la documentación de Oracle y MySQL.
- Si disminuyes la cantidad de tareas de CDC simultáneas, es posible que Datastream retraso con respecto a los registros de la base de datos, lo que, con el tiempo, puede llevar a la pérdida de posición en los registros y fallas de transmisión.
Cantidad máxima de tareas de reabastecimiento
El parámetro maxConcurrentBackfillTasks
te permite controlar la cantidad de reabastecimiento
tareas que una transmisión puede ejecutar en paralelo. Puedes aumentar o disminuir este valor para controlar la capacidad de procesamiento de reabastecimiento.
Entre las características clave del parámetro, se incluyen las siguientes:
- El valor predeterminado es
15
. Puedes establecer este parámetro en cualquier valor entre1
y50
inclusive. - Existe un alto riesgo asociado con el aumento de la simultaneidad de reabastecimiento
porque las tareas de reabastecimiento tienen
un impacto significativo en el rendimiento de la base de datos.
Cada tarea de reabastecimiento ejecuta una consulta
SELECT
sin filtrar en una tabla y, en el caso de las tablas grandes, esas consultas muestran una gran cantidad de filas. - Si disminuyes la simultaneidad de reabastecimiento, no tendrá un impacto negativo en el de la base de datos de origen, excepto porque el reabastecimiento tarda más en completarse.
Cambia los valores de los controles de simultaneidad
Puedes cambiar los valores de los parámetros de control de simultaneidad con el API de Datastream.
- Para obtener información sobre cómo aumentar o disminuir la cantidad de tareas de CDC simultáneas, consulta Cómo cambiar la cantidad máxima de tareas de CDC simultáneas.
- Para obtener información sobre cómo aumentar o disminuir la cantidad de tareas de reabastecimiento simultáneas, consulta Cambia la cantidad máxima de tareas de reabastecimiento simultáneas
¿Qué sigue?
- Consulta cómo administrar transmisiones para obtener más información cómo usar la API de Datastream.
- Consulta la documentación de referencia de la API de Datastream.
para obtener más información sobre el recurso
Stream
.