Gleichzeitigkeitserkennung

Diese Seite bietet einen Überblick über die Steuerelemente für die Nebenläufigkeit von Streams, z. B. die maximale Anzahl gleichzeitiger Change Data Capture-Aufgaben (CDC) und Backfill-Aufgaben. Sie können die Streamleistung steuern, indem Sie die Werte dieser Parameter erhöhen oder verringern.

Gleichzeitigkeitserkennung – Übersicht

Mithilfe der Gleichzeitigkeitserkennung können Sie entweder einen schnelleren Backfill und CDC erzielen oder die Belastung der Quelldatenbank ausgleichen. Wenn Sie höhere Durchsatze benötigen und eine höhere Belastung der Datenbank leisten können, können Sie die Nebenläufigkeit von CDC- und Backfill-Aufgaben erhöhen. Wenn Ihre Datenbank jedoch einer hohen Auslastung unterliegt und Sie eine Überlastung verhindern möchten, können Sie die Werte dieser Parameter reduzieren.

Maximale Anzahl von CDC-Aufgaben

Mit dem Parameter maxConcurrentCdcTasks können Sie die Anzahl der CDC-Aufgaben steuern, die ein Stream parallel ausgeführt wird. Erhöhen Sie den Wert dieses Parameters und lassen Sie Datastream zu, mehr CDC-Logdateien gleichzeitig zu verarbeiten, um den CDC-Durchsatz zu erhöhen.

Zu den wichtigsten Merkmalen des Parameters gehören:

  • Der Standardwert ist 5. Sie können diesen Parameter auf einen beliebigen Wert zwischen 1 und 50 (einschließlich) festlegen.
  • Der Parameter gilt nur für Oracle- und MySQL-Quellen.
  • Der Parameter wirkt sich nur dann aus, wenn mehr Datenbanklogdateien zum Lesen verfügbar sind als CDC-Aufgaben. Die Einstellungen für Logdateien werden von den Konfigurationsparametern der Quelldatenbank gesteuert: die maximale Logdateigröße und das maximale Zeitintervall für die Logrotation. Weitere Informationen zu diesen Parametern finden Sie in der Dokumentation zu Oracle und MySQL.
  • Wenn Sie die Anzahl der gleichzeitigen CDC-Aufgaben reduzieren, bleibt Datastream möglicherweise hinter den Datenbanklogs zurück, was schließlich zu einem Verlust der Logposition und Streamfehlern führen kann.

Maximale Anzahl von Backfill-Aufgaben

Mit dem Parameter maxConcurrentBackfillTasks können Sie die Anzahl der Backfill-Aufgaben steuern, die ein Stream parallel ausführen kann. Sie können diesen Wert erhöhen oder verringern, um den Backfill-Durchsatz zu steuern.

Zu den wichtigsten Merkmalen des Parameters gehören:

  • Der Standardwert ist 15. Sie können diesen Parameter auf einen beliebigen Wert zwischen 1 und 50 (einschließlich) festlegen.
  • Die Erhöhung der Backfill-Nebenläufigkeit birgt ein hohes Risiko, da Backfill-Aufgaben erhebliche Auswirkungen auf die Datenbankleistung haben. Jede Backfill-Aufgabe führt eine ungefilterte SELECT-Abfrage für eine Tabelle aus. Bei großen Tabellen geben solche Abfragen eine große Anzahl von Zeilen zurück.
  • Wenn Sie die Nebenläufigkeit des Backfills verringern, hat dies keine negativen Auswirkungen auf die Quelldatenbank, außer dass der Backfill länger dauert.

Werte der Gleichzeitigkeitserkennung ändern

Sie können die Werte von Gleichzeitigkeitskontrollparametern mithilfe der Datastream API ändern.

Nächste Schritte