Nesta página, mostramos como resolver problemas com a exclusão de clusters efémeros do Dataproc no Cloud Data Fusion.
Quando o Cloud Data Fusion cria um cluster temporário do Dataproc durante o provisionamento da execução do pipeline, o cluster é excluído após a conclusão da execução do pipeline. Em casos raros, a exclusão do cluster falha.
Recomendado: faça upgrade para a versão mais recente do Cloud Data Fusion para garantir a manutenção adequada do cluster.
Definir o tempo máximo de inatividade
Para resolver esse problema, configure o valor Tempo máximo de inatividade. Isso permite que o Dataproc exclua clusters automaticamente, mesmo que uma chamada explícita no final do pipeline falhe.
O Max Idle Time
está disponível nas versões 6.4 e mais recentes do Cloud Data Fusion.
No Cloud Data Fusion 6.6 e versões mais recentes, o tempo máximo de inatividade é definido como 4 horas por padrão.
Para substituir o tempo padrão no perfil de computação padrão, siga estas etapas:
- Abra a instância na interface da Web do Cloud Data Fusion.
- Clique em Administrador do sistema > Configuração > Preferências do sistema.
- Clique em Editar preferências do sistema e adicione a chave
system.profile.properties.idleTTL
e o valor, no formato IntegerUnit, como30m
.
Recomendado: para versões anteriores à 6.6, defina Max Idle Time
manualmente como 30
minutos ou mais.
Excluir clusters manualmente
Se não for possível fazer upgrade da versão ou configurar a opção Max Idle Time
, exclua manualmente os clusters desatualizados:
Encontre o ID de cada projeto em que os clusters foram criados:
Nos argumentos de execução do pipeline, verifique se o ID do projeto do Dataproc foi personalizado para a execução.
Se um ID de projeto do Dataproc não for especificado explicitamente, determine qual provisionador é usado e verifique se há um ID de projeto:
Nos argumentos de ambiente de execução do pipeline, verifique o valor
system.profile.name
.Abra as configurações do provisionador e verifique se o ID do projeto do Dataproc está definido. Se a configuração não estiver presente ou o campo estiver vazio, o projeto em que a instância do Cloud Data Fusion está sendo executada será usado.
Para cada projeto:
Abra o projeto no console do Google Cloud e acesse a página Clusters do Dataproc.
Ordene os clusters pela data de criação, do mais antigo para o mais recente.
Se o painel de informações estiver oculto, clique em Mostrar painel de informações e acesse a guia Rótulos.
Para cada cluster que não está em uso, por exemplo, se mais de um dia se passou, verifique se ele tem um rótulo de versão do Cloud Data Fusion. Isso indica que ela foi criada pelo Cloud Data Fusion.
Marque a caixa de seleção ao lado do nome do cluster e clique em Excluir.
Ignorar a exclusão do cluster
Para fins de depuração, é possível interromper a exclusão automática de um cluster transitório.
Para interromper a exclusão, defina a propriedade Skip Cluster Deletion
como True
. Você
precisa excluir o cluster manualmente depois de terminar a depuração.