Quota de débito

O Vertex AI oferece duas formas de gerir o débito dos seus modelos de IA generativa, o que lhe permite equilibrar o custo, a flexibilidade e o desempenho. Pode usar um modelo flexível de pagamento conforme o uso ou reservar uma quantidade dedicada de débito para um preço fixo.

Pay-as-you-go

Para o modelo de pagamento por utilização predefinido, o Vertex AI usa a quota partilhada dinâmica, que não tem um limite de utilização predefinido. Em vez disso, tem acesso a um grande conjunto partilhado de recursos que são atribuídos dinamicamente com base na disponibilidade e na procura em tempo real.

Este modelo permite que as suas cargas de trabalho usem mais recursos quando estiverem disponíveis. Se receber um erro resource exhausted (429), significa que o conjunto partilhado está a ter temporariamente uma elevada procura de muitos utilizadores em simultâneo. Deve implementar mecanismos de repetição na sua aplicação, uma vez que a disponibilidade pode mudar rapidamente.

Capacidade reservada

Para aplicações de produção críticas que requerem um desempenho consistente e custos previsíveis, pode usar o débito processado. A capacidade de débito aprovisionada é uma subscrição de custo fixo que reserva uma quantidade específica de capacidade de débito para os seus modelos numa localização escolhida.

O que se segue?