실패 정책 구성

aiplatform.PipelineJob 클래스의 failure_policy 매개변수를 사용하여 태스크 중 하나가 실패하면 파이프라인이 즉시 실패해야 하는지 여부를 구성할 수 있습니다.

다음 실패 정책 구성은 Vertex AI Pipelines에서 지원됩니다.

  • 빠른 실패(failure_policy = 'fast'): 태스크 실패 후 파이프라인이 새 태스크 예약을 중지하도록 하려면 이 구성을 선택합니다. 이미 예약된 태스크는 완료될 때까지 계속 실행됩니다.

  • 느린 실패(failure_policy = 'slow'): 태스크 실패 후에도 파이프라인이 계속 실행되도록 하려면 이 구성을 선택합니다. 모든 태스크가 실행될 때까지 파이프라인이 계속 실행됩니다.

Python용 Vertex AI SDK를 사용하여 파이프라인의 실패 정책을 구성하려면 다음 코드 샘플을 사용합니다.


job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
                             template_path = 'COMPILED_PIPELINE_PATH',
                             pipeline_root = 'PIPELINE_ROOT',
                             project = 'PROJECT_ID',
                             location = 'LOCATION',
                             failure_policy = 'FAILURE_POLICY')

다음을 바꿉니다.

  • DISPLAY_NAME: 파이프라인 이름으로. Google Cloud 콘솔에 표시됩니다.

  • COMPILED_PIPELINE_PATH: 컴파일된 파이프라인 YAML 파일의 경로입니다. 로컬 경로 또는 Google Cloud Storage URI일 수 있습니다.

  • PIPELINE_ROOT: 파이프라인 서비스 계정이 액세스할 수 있는 Cloud Storage URI를 지정합니다. 파이프라인 실행의 아티팩트는 파이프라인 루트 내에 저장됩니다.

  • PROJECT_ID: 이 파이프라인이 실행되는 Google Cloud 프로젝트입니다.

  • LOCATION: 파이프라인이 실행되는 리전입니다. Vertex AI 파이프라인을 사용할 수 있는 리전에 대한 자세한 내용은 Vertex AI 위치 가이드를 참조하세요. 이 매개변수를 설정하지 않으면 aiplatform.init에 설정된 기본 위치가 사용됩니다.

  • FAILURE_POLICY: 전체 파이프라인의 실패 정책을 지정합니다. 사용 가능한 구성은 다음과 같습니다.

    • 태스크 하나가 실패한 후 파이프라인이 실패하도록 구성하려면 fast를 입력합니다.

    • 태스크 하나가 실패한 후에도 태스크를 계속 예약하도록 파이프라인을 구성하려면 slow를 입력합니다.

    이 매개변수를 설정하지 않으면 실패 정책 구성이 기본적으로 slow로 설정됩니다.