Einstellungen für die Stream-Gleichzeitigkeit

Auf dieser Seite finden Sie eine Übersicht über die Einstellungen für die Stream-Parallelität, z. B. die maximale Anzahl gleichzeitiger CDC-Aufgaben (Change Data Capture) und Backfill-Aufgaben. Sie können die Streamleistung steuern, indem Sie die Werte dieser Parameter erhöhen oder verringern.

Gleichzeitigkeitserkennung – Übersicht

Mit der Gleichzeitigkeitserkennung können Sie den Backfill und die CDC beschleunigen, oder die Last in der Quelldatenbank auszugleichen. Wenn Sie höhere Durchsatzraten benötigen, und eine höhere Belastung für die Datenbank leisten können, können Sie die Nebenläufigkeit erhöhen, von CDC- und Backfill-Aufgaben. Wenn Ihre Datenbank dagegen stark ausgelastet ist und Sie sie vor einer Überlastung schützen möchten, können Sie die Werte dieser Parameter verringern.

Maximale Anzahl von CDC-Aufgaben

Mit dem Parameter maxConcurrentCdcTasks können Sie die Anzahl der CDC-Aufgaben steuern, die ein Stream parallel ausführt. Wenn Sie den CDC-Durchsatz erhöhen möchten, erhöhen Sie den Wert dieses Parameters und erlauben Sie Datastream, gleichzeitig mehr CDC-Protokolldateien zu verarbeiten.

Zu den wichtigsten Merkmalen des Parameters gehören:

  • Der Standardwert ist 5. Sie können diesen Parameter auf einen beliebigen Wert zwischen 1 und 50 festlegen.
  • Der Parameter gilt nur für Oracle- und MySQL-Quellen.
  • Der Parameter wirkt sich nur aus, wenn mehr Datenbanklogdateien verfügbar sind als CDC-Aufgaben gibt. Die Einstellungen für die Protokolldateien werden durch die Konfigurationsparameter der Quelldatenbank gesteuert: die maximale Protokolldateigröße und das maximale Zeitintervall für die Protokollrotation. Weitere Informationen zu diesen Parametern finden Sie in der Oracle- und MySQL-Dokumentation.
  • Wenn Sie die Anzahl der gleichzeitigen CDC-Aufgaben verringern, kann Datastream hinter den Datenbankprotokollen zurückbleiben. Dies kann zu einem Verlust der Protokollposition und einem Streamfehler führen.

Maximale Anzahl von Backfill-Aufgaben

Mit dem Parameter maxConcurrentBackfillTasks können Sie die Anzahl der Backfill-Aufgaben steuern, die für einen Stream parallel ausgeführt werden können. Sie können diesen Wert erhöhen oder verringern um den Backfill-Durchsatz zu steuern.

Zu den wichtigsten Merkmalen des Parameters gehören:

  • Der Standardwert ist 15. Sie können diesen Parameter auf einen beliebigen Wert zwischen 1 und 50 (einschließlich).
  • Das Risiko, die Backfill-Parallelität zu erhöhen, ist hoch, da Backfill-Aufgaben erhebliche Auswirkungen auf die Datenbankleistung haben. Jede Backfill-Aufgabe führt eine ungefilterte SELECT-Abfrage für eine Tabelle aus. großen Tabellen führen, geben solche Abfragen eine große Anzahl von Zeilen zurück.
  • Wenn Sie die Nebenläufigkeit des Backfills verringern, hat dies keine negativen Auswirkungen auf den Quelldatenbank, außer dass der Backfill länger dauert.

Werte der Gleichzeitigkeitserkennung ändern

Sie können die Werte der Parameter für die Parallelitätssteuerung mit der Datastream API ändern.

Nächste Schritte