aiplatform.PipelineJob
클래스의 failure_policy
매개변수를 사용하여 태스크 중 하나가 실패하면 파이프라인이 즉시 실패해야 하는지 여부를 구성할 수 있습니다.
다음 실패 정책 구성은 Vertex AI Pipelines에서 지원됩니다.
빠른 실패(
failure_policy = 'fast'
): 태스크 실패 후 파이프라인이 새 태스크 예약을 중지하도록 하려면 이 구성을 선택합니다. 이미 예약된 태스크는 완료될 때까지 계속 실행됩니다.느린 실패(
failure_policy = 'slow'
): 태스크 실패 후에도 파이프라인이 계속 실행되도록 하려면 이 구성을 선택합니다. 모든 태스크가 실행될 때까지 파이프라인이 계속 실행됩니다.
Python용 Vertex AI SDK를 사용하여 파이프라인의 실패 정책을 구성하려면 다음 코드 샘플을 사용합니다.
job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
template_path = 'COMPILED_PIPELINE_PATH',
pipeline_root = 'PIPELINE_ROOT',
project = 'PROJECT_ID',
location = 'LOCATION',
failure_policy = 'FAILURE_POLICY')
다음을 바꿉니다.
DISPLAY_NAME: 파이프라인 이름으로. Google Cloud 콘솔에 표시됩니다.
COMPILED_PIPELINE_PATH: 컴파일된 파이프라인 YAML 파일의 경로입니다. 로컬 경로 또는 Google Cloud Storage URI일 수 있습니다.
PIPELINE_ROOT: 파이프라인 서비스 계정이 액세스할 수 있는 Cloud Storage URI를 지정합니다. 파이프라인 실행의 아티팩트는 파이프라인 루트 내에 저장됩니다.
PROJECT_ID: 이 파이프라인이 실행되는 Google Cloud 프로젝트입니다.
LOCATION: 파이프라인이 실행되는 리전입니다. Vertex AI 파이프라인을 사용할 수 있는 리전에 대한 자세한 내용은 Vertex AI 위치 가이드를 참조하세요. 이 매개변수를 설정하지 않으면
aiplatform.init
에 설정된 기본 위치가 사용됩니다.FAILURE_POLICY: 전체 파이프라인의 실패 정책을 지정합니다. 사용 가능한 구성은 다음과 같습니다.
태스크 하나가 실패한 후 파이프라인이 실패하도록 구성하려면
fast
를 입력합니다.태스크 하나가 실패한 후에도 태스크를 계속 예약하도록 파이프라인을 구성하려면
slow
를 입력합니다.
이 매개변수를 설정하지 않으면 실패 정책 구성이 기본적으로
slow
로 설정됩니다.
다음 단계
- 실패한 파이프라인 태스크의 재시도를 구성하는 방법을 알아보세요.