É possível usar o parâmetro failure_policy
da classe aiplatform.PipelineJob
para configurar se um pipeline falhará imediatamente se uma das tarefas falhar.
As configurações de política de falha a seguir são suportadas com os pipelines da Vertex AI:
Falha rápida (
failure_policy = 'fast'
): escolha essa configuração se quiser que o pipeline pare de programar novas tarefas se uma tarefa falhar. As tarefas já programadas continuam em execução até serem concluídas.Falha lenta (
failure_policy = 'slow'
): escolha essa configuração se você quiser que o pipeline continue em execução mesmo depois que uma tarefa falhar. O pipeline continua em execução até que todas as tarefas tenham sido executadas.
Use o exemplo de código a seguir para configurar a política de falha de um pipeline usando o SDK Vertex AI para Python:
job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
template_path = 'COMPILED_PIPELINE_PATH',
pipeline_root = 'PIPELINE_ROOT',
project = 'PROJECT_ID',
location = 'LOCATION',
failure_policy = 'FAILURE_POLICY')
Substitua:
DISPLAY_NAME: o nome do pipeline, que é mostrado no console do Google Cloud.
COMPILED_PIPELINE_PATH: o caminho para o arquivo YAML do pipeline compilado. Pode ser um caminho local ou um URI do Google Cloud Storage.
PIPELINE_ROOT: especifique um URI do Cloud Storage que sua conta de serviço de pipelines possa acessar. Os artefatos das execuções de pipeline são armazenados na raiz do pipeline.
PROJECT_ID: o projeto do Google Cloud em que este pipeline é executado.
LOCATION: a região em que o pipeline é executado. Para mais informações sobre as regiões em que o Pipelines da Vertex AI está disponível, consulte o guia de locais da Vertex AI. Se você não definir esse parâmetro, o local padrão definido em
aiplatform.init
é usado.FAILURE_POLICY: especifica a política de falha para todo o pipeline. As seguintes configurações estão disponíveis:
Para configurar o pipeline para falhar se uma tarefa falhar, digite
fast
.Para configurar o pipeline de modo a continuar a programar tarefas se uma tarefa falhar, insira
slow
.
Se você não definir o parâmetro, a configuração da política de falha é definida como
slow
, por padrão.