이벤트 기반 함수 재시도 사용 설정
이 문서에서는 이벤트 기반 함수에 대해 재시도를 사용 설정하는 방법을 설명합니다. HTTP 함수에서는 자동 재시도를 사용할 수 없습니다.
재시도 의미 체계
Cloud Run Functions는 이벤트 소스에서 전송한 각 이벤트에 대해 이벤트 기반 함수를 최소한 1회 실행합니다. 기본적으로 함수 호출이 오류 발생으로 종료되면 해당 함수는 다시 호출되지 않으며 이벤트는 삭제됩니다. 이벤트 기반 함수에 재시도를 사용 설정하면 Cloud Run Functions는 실패한 함수 호출을 성공할 때까지 또는 재시도 기간이 만료할 때까지 다시 시도합니다.
이 재시도 기간은 24시간 후에 만료됩니다. Cloud Run Functions는 지수 백오프 전략을 사용하여 새로 생성된 이벤트 기반 함수를 재시도하며, 백오프는 10~600초까지 증가합니다.기본값인 함수에 대해 재시도가 사용 설정되지 않은 경우 함수가 항상 성공적으로 실행된 것으로 보고하고 200 OK
응답 코드가 로그에 나타날 수 있습니다. 이것은 함수에 오류가 발생한 경우에도 수행됩니다. 함수에 오류가 발생할 때 이를 명확하게 표시하려면 오류 보고를 적절히 수행해야 합니다.
이벤트 기반 함수를 완료하는 데 실패하는 이유
드문 경우지만 내부 오류로 인해 함수가 조기 종료될 수 있으며 기본값에 따라 함수가 자동으로 재시도되거나 재시도되지 않을 수 있습니다.
보통은 함수 코드 자체에 발생한 오류로 인해 이벤트 기반 함수를 완료하는 데 실패할 수 있습니다. 이러한 문제가 발생할 수 있는 이유는 다음과 같습니다.
- 함수에 버그가 있으며 런타임에서 예외가 발생합니다.
- 함수가 서비스 엔드포인트에 도달할 수 없거나 도달하려고 시도하는 중에 제한 시간이 초과되었습니다.
- 예를 들어 매개변수가 유효성 검사에 실패하는 경우 등 함수에서 의도적인 예외가 발생합니다.
- Node.js 함수가 거부된 프라미스를 반환하거나
null
외의 값을 콜백에 전달합니다.
이러한 경우 기본적으로 함수 실행이 중지되고 이벤트가 삭제됩니다. 오류 발생 시 함수를 재시도하려면 '실패 시 재시도' 속성을 설정하여 기본 재시도 정책을 변경하면 됩니다. 그러면 함수가 성공적으로 완료되거나 재시도 제한 시간이 만료될 때까지 이벤트가 반복적으로 재시도됩니다.
재시도 사용 설정 또는 중지
gcloud
명령줄 도구 또는 Google Cloud 콘솔을 사용하여 재시도를 사용 설정 또는 중지할 수 있습니다. 기본적으로 재시도는 중지되어 있습니다.
gcloud
명령줄 도구에서 재시도 구성
gcloud
명령줄 도구를 사용하여 재시도를 사용 설정하려면 다음과 같이 함수 배포 시 --retry
플래그를 포함합니다.
gcloud functions deploy FUNCTION_NAME --retry FLAGS...
재시도를 중지하려면 --retry
플래그 없이 함수를 다시 배포합니다.
gcloud functions deploy FUNCTION_NAME FLAGS...
콘솔에서 재시도 구성
새 함수를 만드는 경우 다음 안내를 따르세요.
- 함수 만들기 화면의 트리거 아래에서 함수의 트리거로 사용할 이벤트 유형을 선택합니다.
- 실패 시 재시도 체크박스를 선택하여 재시도를 사용 설정합니다.
기존 함수를 업데이트하는 경우 다음 안내를 따르세요.
- Cloud Run Functions 개요 페이지에서 업데이트 중인 함수의 이름을 클릭하여 함수 세부정보 화면을 연 다음 메뉴 바에서 수정을 선택하여 트리거 창을 표시합니다.
- 실패 시 재시도 체크박스를 선택하거나 선택 해제하여 재시도를 사용 설정 또는 중지합니다.
권장사항
이 섹션에서는 재시도 사용의 권장사항을 설명합니다.
재시도를 사용하여 일시적인 오류 처리
함수는 성공적으로 실행될 때까지 지속적으로 재시도되므로 재시도를 사용 설정하기 전에 테스트를 통해 버그와 같은 영구적인 오류를 코드에서 제거해야 합니다. 재시도는 불안정한 서비스 엔드포인트 또는 시간 초과와 같이 재시도하면 해결될 가능성이 매우 높은 간헐적이거나 일시적인 실패를 처리하는 데 가장 적합합니다.
무한 재시도 루프를 방지하기 위해 종료 조건 설정
재시도를 사용할 때 함수가 지속적인 루프에 빠지지 않도록 조치를 취하는 것이 좋습니다. 함수 처리가 시작되기 전에 명확하게 정의된 종료 조건을 포함하면 됩니다. 함수가 성공적으로 시작되고 종료 조건을 평가할 수 있는 경우에만 이 방법을 사용할 수 있습니다.
간단하면서도 효과적인 방법은 특정 시간보다 오래된 타임스탬프가 있는 이벤트를 삭제하는 것입니다. 이렇게 하면 지속적으로 실패하거나 예상보다 오래 실패할 경우에 과도하게 많이 실행되는 것을 방지할 수 있습니다.
예를 들어 이 코드 스니펫은 10초보다 오래된 모든 이벤트를 삭제합니다.
Node.js
Python
Go
자바
C#
Ruby
PHP
재시도할 수 있는 함수와 심각한 오류 구분
함수 재시도가 사용 설정되면 처리되지 않은 오류가 재시도를 트리거합니다. 코드에서 재시도를 초래해서는 안 되는 오류가 포착되는지 확인하세요.
Node.js
Python
Go
자바
C#
Ruby
PHP
재시도 가능한 이벤트 기반 함수 멱등성 만들기
재시도할 수 있는 이벤트 기반 함수는 멱등성이 있어야 합니다. 이러한 함수 멱등성을 만들기 위한 일반적인 가이드는 다음과 같습니다.
- Stripe와 같은 다양한 외부 API를 사용하면 매개변수로 멱등 키를 제공할 수 있습니다. 이러한 API를 사용한다면 이벤트 ID를 멱등 키로 사용해야 합니다.
- 멱등성이 있으면 재시도해도 안전하므로 최소 1회 전송 시 잘 작동합니다. 따라서 안정적인 코드를 작성하기 위한 일반적인 권장사항은 재시도와 멱등성을 결합하는 것입니다.
- 코드에 내부적으로 멱등성이 있어야 합니다. 예를 들면 다음과 같습니다.
- 결과에 변화 없이 변형이 2번 이상 발생할 수 있는지 확인합니다.
- 상태가 변형되기 전에 트랜잭션에서 데이터베이스 상태를 쿼리합니다.
- 모든 부가적인 결과에 자체적으로 멱등성이 있는지 확인합니다.
- 코드에 관계없이 함수 외부에서 트랜잭션 검사를 시행합니다. 예를 들어 특정 이벤트 ID가 이미 처리되었음을 어딘가에 기록하는 상태를 유지합니다.
- 중복 함수 호출을 대역 외로 처리합니다. 예를 들어 중복 함수가 호출된 후 삭제하는 별도의 삭제 프로세스를 둡니다.
재시도 정책 구성
Cloud Run 함수의 요구사항에 따라 재시도 정책을 직접 구성할 수 있습니다. 이렇게 하면 다음을 원하는 대로 조합하여 설정할 수 있습니다.
- 재시도 기간을 7일에서 10분으로 단축합니다.
- 지수 백오프 재시도 전략의 최소 및 최대 백오프 시간을 변경합니다.
- 즉시 재시도하도록 재시도 전략을 변경합니다.
- 데드 레터 주제를 구성합니다.
- 전송 시도의 최대 및 최소 횟수를 설정합니다.
재시도 정책을 구성하려면 다음 안내를 따르세요.
- HTTP 함수를 작성합니다.
- Pub/Sub API를 사용하여 Pub/Sub 구독을 만들고 함수의 URL을 대상으로 지정합니다.
Pub/Sub 직접 구성에 대한 자세한 내용은 오류 처리에 관한 Pub/Sub 문서를 참조하세요.
다음 단계
- Cloud Run Functions 배포
- Pub/Sub 트리거 함수 호출
- Cloud Storage 트리거 함수 호출
- Pub/Sub를 이용한 Cloud Run Functions 튜토리얼
- Cloud Storage를 이용한 Cloud Run Functions 튜토리얼