Visão geral do recurso permanente

Um recurso permanente da Vertex AI é um cluster de longa duração que pode ser criado para executar jobs de treinamento personalizados. Após a conclusão de um job de treinamento, o recurso permanente permanece disponível para executar outros até que você o exclua. É possível usar um recurso persistente para garantir a disponibilidade de recursos de computação e reduzir o tempo de inicialização do job que seria necessário para a criação do recurso de computação. Os recursos permanentes dão suporte a todas as VMs e GPUs compatíveis com jobs de treinamento personalizados. Nesta página, explicamos quando usar um recurso persistente e fornecemos informações sobre faturamento e cota.

Quando usar um recurso persistente

Recomendamos o uso de recursos persistentes nos seguintes cenários:

  • Você quer garantir a disponibilidade de capacidade para cargas de trabalho essenciais de ML ou durante os períodos de pico. Ao contrário dos jobs personalizados, em que o serviço de treinamento libera o recurso após a conclusão do job, o recurso permanente permanece disponível até ser excluído.
  • Você está enviando o mesmo job várias vezes e pode se beneficiar do armazenamento de dados e armazenamento de imagens em cache executando os jobs no mesmo recurso persistente.
  • Você executa muitos jobs de treinamento de curta duração em que o tempo de treinamento real é menor que o tempo de inicialização do job.

Para mais contexto sobre quando e por que usar um recurso persistente, consulte a postagem do blog Como trazer a garantia de capacidade e tempos de inicialização mais rápidos para o Vertex AI Training.

Detalhes de faturamento

A cobrança é feita durante todo o período em que um recurso permanente está em estado de execução, independentemente de haver um job em execução nesse recurso. Para cada instância no pool de recursos persistente, a cobrança é feita por hora principal. Todos os jobs em execução em um recurso persistente não são cobrados separadamente. A cobrança é feita apenas pelo recurso persistente.

Se você configurar o escalonamento automático do seu recurso permanente, pagará apenas pelas instâncias provisionadas. Por exemplo, se min-replica-count for definido como 4, instâncias 4 serão sempre provisionadas, e esse será o valor mínimo cobrado. Quando a carga de trabalho aumenta, o pool de recursos pode ser escalonado até 6 para acomodar o aumento da demanda. Em seguida, você será cobrado pelas instâncias provisionadas 6 até que o pool de recursos seja reduzido novamente. Para evitar o pagamento por nós ociosos, use o escalonamento automático do recurso permanente ou exclua-o quando não precisar mais dele. Para saber mais sobre preços, consulte a seção Modelos treinados e personalizados na página de preços da Vertex AI.

Cotas

Os recursos permanentes usam sua cota de treinamento. Portanto, verifique se você tem cota suficiente para a criação de recursos permanentes. Para saber mais sobre cotas, consulte Cotas e limites de treinamento.

A seguir