Auf dieser Seite finden Sie eine Übersicht über die Einstellungen für die Stream-Parallelität, z. B. die maximale Anzahl gleichzeitiger CDC-Aufgaben (Change Data Capture) und Backfill-Aufgaben. Sie können die Streamleistung steuern, indem Sie die Werte dieser Parameter erhöhen oder verringern.
Gleichzeitigkeitserkennung – Übersicht
Mit der Gleichzeitigkeitserkennung können Sie den Backfill und die CDC beschleunigen, oder die Last in der Quelldatenbank auszugleichen. Wenn Sie höhere Durchsatzraten benötigen, und eine höhere Belastung für die Datenbank leisten können, können Sie die Nebenläufigkeit erhöhen, von CDC- und Backfill-Aufgaben. Wenn Ihre Datenbank dagegen stark ausgelastet ist und Sie sie vor einer Überlastung schützen möchten, können Sie die Werte dieser Parameter verringern.
Maximale Anzahl von CDC-Aufgaben
Mit dem Parameter maxConcurrentCdcTasks
können Sie die Anzahl der CDC-Aufgaben steuern, die ein Stream parallel ausführt. Wenn Sie den CDC-Durchsatz erhöhen möchten, erhöhen Sie den Wert dieses Parameters und erlauben Sie Datastream, gleichzeitig mehr CDC-Protokolldateien zu verarbeiten.
Zu den wichtigsten Merkmalen des Parameters gehören:
- Der Standardwert ist
5
. Sie können diesen Parameter auf einen beliebigen Wert zwischen1
und50
festlegen. - Der Parameter gilt nur für Oracle- und MySQL-Quellen.
- Der Parameter wirkt sich nur aus, wenn mehr Datenbanklogdateien verfügbar sind als CDC-Aufgaben gibt. Die Einstellungen für die Protokolldateien werden durch die Konfigurationsparameter der Quelldatenbank gesteuert: die maximale Protokolldateigröße und das maximale Zeitintervall für die Protokollrotation. Weitere Informationen zu diesen Parametern finden Sie in der Oracle- und MySQL-Dokumentation.
- Wenn Sie die Anzahl der gleichzeitigen CDC-Aufgaben verringern, kann Datastream hinter den Datenbankprotokollen zurückbleiben. Dies kann zu einem Verlust der Protokollposition und einem Streamfehler führen.
Maximale Anzahl von Backfill-Aufgaben
Mit dem Parameter maxConcurrentBackfillTasks
können Sie die Anzahl der Backfill-Aufgaben steuern, die für einen Stream parallel ausgeführt werden können. Sie können diesen Wert erhöhen oder verringern
um den Backfill-Durchsatz zu steuern.
Zu den wichtigsten Merkmalen des Parameters gehören:
- Der Standardwert ist
15
. Sie können diesen Parameter auf einen beliebigen Wert zwischen1
und50
(einschließlich). - Das Risiko, die Backfill-Parallelität zu erhöhen, ist hoch, da Backfill-Aufgaben erhebliche Auswirkungen auf die Datenbankleistung haben.
Jede Backfill-Aufgabe führt eine ungefilterte
SELECT
-Abfrage für eine Tabelle aus. großen Tabellen führen, geben solche Abfragen eine große Anzahl von Zeilen zurück. - Wenn Sie die Nebenläufigkeit des Backfills verringern, hat dies keine negativen Auswirkungen auf den Quelldatenbank, außer dass der Backfill länger dauert.
Werte der Gleichzeitigkeitserkennung ändern
Sie können die Werte der Parameter für die Parallelitätssteuerung mit der Datastream API ändern.
- Informationen zum Erhöhen oder Verringern der Anzahl der gleichzeitigen CDC-Aufgaben finden Sie unter Maximale Anzahl gleichzeitiger CDC-Aufgaben ändern.
- Informationen zum Erhöhen oder Verringern der Anzahl der gleichzeitigen Backfill-Aufgaben finden Sie unter Anzahl der maximalen gleichzeitigen Backfill-Aufgaben ändern.
Nächste Schritte
- Weitere Informationen finden Sie unter Streams verwalten. wie Sie die Datastream API verwenden.
- Weitere Informationen zur
Stream
-Ressource finden Sie in der Datastream API-Referenzdokumentation.