Cette page présente les commandes de simultanéité des flux, telles que le nombre maximal de tâches de capture des données de modification (CDC) et de remplissage simultanées. Vous pouvez contrôler les performances du flux en augmentant ou en diminuant les valeurs de ces paramètres.
Présentation des contrôles de simultanéité
En utilisant les commandes de simultanéité, vous pouvez accélérer le remplissage et la CDC, ou équilibrer la charge sur la base de données source. Si vous avez besoin de débits plus élevés et que vous pouvez supporter une charge plus élevée sur la base de données, vous pouvez augmenter la simultanéité des tâches CDC et de remplissage. À l'inverse, si votre base de données est soumise à une charge élevée et que vous souhaitez la protéger contre la surcharge, vous pouvez réduire les valeurs de ces paramètres.
Nombre maximal de tâches CDC
Le paramètre maxConcurrentCdcTasks
vous permet de contrôler le nombre de tâches CDC qu'un flux exécute en parallèle. Pour augmenter le débit de la CDC, augmentez la valeur de ce paramètre et autorisez Datastream à traiter davantage de fichiers journaux de la CDC en même temps.
Voici les principales caractéristiques du paramètre:
- La valeur par défaut est
5
. Vous pouvez définir ce paramètre sur n'importe quelle valeur comprise entre1
et50
inclus. - Ce paramètre ne s'applique qu'aux sources Oracle et MySQL.
- Le paramètre n'a d'incidence que si le nombre de fichiers journaux de base de données disponibles à lire est supérieur au nombre de tâches CDC. Les paramètres des fichiers journaux sont contrôlés par les paramètres de configuration de la base de données source: la taille maximale du fichier journal et l'intervalle de rotation maximal des journaux. Pour en savoir plus sur ces paramètres, consultez la documentation Oracle et MySQL.
- Si vous diminuez le nombre de tâches CDC simultanées, Datastream peut être à la traîne par rapport aux journaux de la base de données, ce qui peut entraîner une perte de position de journal et un échec du flux.
Nombre maximal de tâches de remplissage
Le paramètre maxConcurrentBackfillTasks
vous permet de contrôler le nombre de tâches de remplissage qu'un flux peut exécuter en parallèle. Vous pouvez augmenter ou diminuer cette valeur pour contrôler le débit de remplissage.
Voici les principales caractéristiques du paramètre:
- La valeur par défaut est
15
. Vous pouvez définir ce paramètre sur n'importe quelle valeur comprise entre1
et50
inclus. - L'augmentation de la concurrence de remplissage présente un risque élevé, car les tâches de remplissage ont un impact significatif sur les performances de la base de données.
Chaque tâche de remplissage exécute une requête
SELECT
non filtrée sur une table. Pour les grandes tables, ces requêtes renvoient un grand nombre de lignes. - Si vous diminuez la simultanéité de remplissage, cela n'a aucun impact négatif sur la base de données source, sauf que le remplissage prend plus de temps.
Modifier les valeurs des commandes de simultanéité
Vous pouvez modifier les valeurs des paramètres de contrôle de la concurrence à l'aide de l'API Datastream.
- Pour savoir comment augmenter ou réduire le nombre de tâches CDC simultanées, consultez la section Modifier le nombre maximal de tâches CDC simultanées.
- Pour savoir comment augmenter ou réduire le nombre de tâches de remplissage simultanées, consultez la section Modifier le nombre maximal de tâches de remplissage simultanées.
Étape suivante
- Pour en savoir plus sur l'utilisation de l'API Datastream, consultez la section Gérer les flux.
- Pour en savoir plus sur la ressource
Stream
, consultez la documentation de référence de l'API Datastream.