스트림 동시 실행 제어

이 페이지에서는 최대 동시 변경 데이터 캡처(CDC) 태스크 및 백필 태스크와 같은 스트림 동시 실행 제어를 간략하게 설명합니다. 이러한 매개변수의 값을 늘리거나 줄여 스트림 성능을 제어할 수 있습니다.

동시 실행 제어 개요

동시 실행 제어를 사용하면 백필과 CDC를 더 빠르게 수행하거나 소스 데이터베이스를 부하 분산할 수 있습니다. 더 높은 처리량이 필요하고 데이터베이스에서 더 높은 부하를 감당할 수 있는 경우 CDC 및 백필 태스크의 동시 실행을 늘릴 수 있습니다. 반대로 데이터베이스에 과부하가 발생하여 과부하로부터 보호하려는 경우 이러한 매개변수의 값을 줄일 수 있습니다.

최대 CDC 태스크 수

maxConcurrentCdcTasks 매개변수를 사용하면 스트림이 동시에 실행되는 CDC 태스크 수를 제어할 수 있습니다. CDC 처리량을 확장하려면 이 매개변수의 값을 늘리고 Datastream이 동시에 더 많은 CDC 로그 파일을 처리하도록 허용합니다.

매개변수의 주요 특성은 다음과 같습니다.

  • 기본값은 5입니다. 이 매개변수를 150 사이의 값(1, 50 포함)으로 설정할 수 있습니다.
  • 매개변수는 Oracle 및 MySQL 소스에만 적용됩니다.
  • 이 매개변수는 CDC 태스크보다 읽기 가능한 데이터베이스 로그 파일이 더 많은 경우에만 영향을 미칩니다. 로그 파일 설정은 최대 로그 파일 크기 및 최대 로그 순환 시간 간격인 소스 데이터베이스 구성 매개변수에 의해 제어됩니다. 이러한 매개변수에 대한 자세한 내용은 Oracle 및 MySQL 문서를 참조하세요.
  • 동시 CDC 태스크 수를 줄이면 Datastream이 데이터베이스 로그보다 지연되어 로그 위치 손실 및 스트림 실패가 발생할 수 있습니다.

최대 백필 태스크 수

maxConcurrentBackfillTasks 매개변수를 사용하면 스트림이 동시에 실행할 수 있는 백필 태스크 수를 제어할 수 있습니다. 이 값을 늘리거나 줄여 백필 처리량을 제어할 수 있습니다.

매개변수의 주요 특성은 다음과 같습니다.

  • 기본값은 15입니다. 이 매개변수를 150 사이의 값(1, 50 포함)으로 설정할 수 있습니다.
  • 백필 태스크는 데이터베이스 성능에 큰 영향을 미치므로 백필 동시 실행 값을 늘릴 위험이 높습니다. 각 백필 태스크는 테이블에서 필터링되지 않은 SELECT 쿼리를 실행하고 대규모 테이블의 경우 많은 행을 반환합니다.
  • 백필 동시 실행을 줄일 경우 백필을 완료하는 데 시간이 오래 걸리는 것을 제외하고 소스 데이터베이스에 부정적인 영향을 미치지 않습니다.

동시 실행 제어 값 변경

Datastream API를 사용하여 동시 실행 제어 매개변수의 값을 변경할 수 있습니다.

다음 단계