Um recurso permanente da Vertex AI é um cluster de longa duração que pode ser criado para executar jobs de treinamento personalizados. Após a conclusão de um job de treinamento, o recurso permanente permanece disponível para executar outros até que você o exclua. É possível usar um recurso persistente para garantir a disponibilidade de recursos de computação e reduzir o tempo de inicialização do job que seria necessário para a criação do recurso de computação. Os recursos permanentes dão suporte a todas as VMs e GPUs compatíveis com jobs de treinamento personalizados. Nesta página, explicamos quando usar um recurso persistente e fornecemos informações sobre faturamento e cota.
Quando usar um recurso persistente
Recomendamos o uso de recursos persistentes nos seguintes cenários:
- Você quer garantir a disponibilidade de capacidade para cargas de trabalho essenciais de ML ou durante os períodos de pico. Ao contrário dos jobs personalizados, em que o serviço de treinamento libera o recurso após a conclusão do job, o recurso permanente permanece disponível até ser excluído.
- Você está enviando o mesmo job várias vezes e pode se beneficiar do armazenamento de dados e armazenamento de imagens em cache executando os jobs no mesmo recurso persistente.
- Você executa muitos jobs de treinamento de curta duração em que o tempo de treinamento real é menor que o tempo de inicialização do job.
Para mais contexto sobre quando e por que usar um recurso persistente, consulte a postagem do blog Como trazer a garantia de capacidade e tempos de inicialização mais rápidos para o Vertex AI Training.
Detalhes de faturamento
A cobrança é feita durante todo o período em que um recurso permanente está em estado de execução, independentemente de haver um job em execução nesse recurso. Para cada instância no pool de recursos persistente, a cobrança é feita por hora principal. Todos os jobs em execução em um recurso persistente não são cobrados separadamente. A cobrança é feita apenas pelo recurso persistente.
Se você configurar o escalonamento automático do seu recurso permanente, pagará apenas pelas instâncias provisionadas. Por exemplo, se min-replica-count
for definido como 4
,
instâncias 4
serão sempre provisionadas, e esse será o valor mínimo cobrado. Quando a carga de trabalho aumenta, o pool de recursos pode ser escalonado até 6
para acomodar o aumento da demanda. Em seguida, você será cobrado pelas instâncias provisionadas 6
até que o pool de recursos seja reduzido novamente. Para evitar o pagamento por nós ociosos, use o escalonamento automático do recurso permanente ou exclua-o quando não precisar mais dele. Para saber mais sobre preços, consulte a seção Modelos treinados e personalizados na página de preços da Vertex AI.
Cotas
Os recursos permanentes usam sua cota de treinamento. Portanto, verifique se você tem cota suficiente para a criação de recursos permanentes. Para saber mais sobre cotas, consulte Cotas e limites de treinamento.
A seguir
- Crie e use um recurso permanente.
- Executar jobs de treinamento em um recurso persistente
- Receba informações sobre um recurso persistente.
- Reinicialize um recurso persistente.
- Exclua um recurso persistente.