Esta página foi traduzida pela API Cloud Translation.

Quota de débito

O Vertex AI oferece duas formas de gerir o débito dos seus modelos de IA generativa, o que lhe permite equilibrar o custo, a flexibilidade e o desempenho. Pode usar um modelo flexível de pagamento conforme o uso ou reservar uma quantidade dedicada de débito para um preço fixo.

Pay-as-you-go

Para o modelo de pagamento por utilização predefinido, o Vertex AI usa a quota partilhada dinâmica, que não tem um limite de utilização predefinido. Em vez disso, tem acesso a um grande conjunto partilhado de recursos que são atribuídos dinamicamente com base na disponibilidade e na procura em tempo real.

Este modelo permite que as suas cargas de trabalho usem mais recursos quando estiverem disponíveis. Se receber um erro resource exhausted (429), significa que o conjunto partilhado está a ter temporariamente uma elevada procura de muitos utilizadores em simultâneo. Deve implementar mecanismos de repetição na sua aplicação, uma vez que a disponibilidade pode mudar rapidamente.

Capacidade reservada

Para aplicações de produção críticas que requerem um desempenho consistente e custos previsíveis, pode usar o débito processado. A capacidade de débito aprovisionada é uma subscrição de custo fixo que reserva uma quantidade específica de capacidade de débito para os seus modelos numa localização escolhida.

O que se segue?

Saiba mais acerca da quota partilhada dinâmica.
Saiba mais acerca do débito aprovisionado.
Saiba mais sobre as cotas do Google Cloud.

Quota de débito Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Pay-as-you-go

Capacidade reservada

O que se segue?

Quota de débito