Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
O Vertex AI oferece duas formas de gerir o débito dos seus modelos de IA generativa, o que lhe permite equilibrar o custo, a flexibilidade e o desempenho. Pode usar um modelo flexível de pagamento conforme o uso ou reservar uma quantidade dedicada de débito para um preço fixo.
Pay-as-you-go
Para o modelo de pagamento por utilização predefinido, o Vertex AI usa a quota partilhada dinâmica, que não tem um limite de utilização predefinido. Em vez disso, tem acesso a um grande conjunto partilhado de recursos que são atribuídos dinamicamente com base na disponibilidade e na procura em tempo real.
Este modelo permite que as suas cargas de trabalho usem mais recursos quando estiverem disponíveis.
Se receber um erro resource exhausted (429), significa que o conjunto partilhado está a
ter temporariamente uma elevada procura de muitos utilizadores em simultâneo. Deve implementar mecanismos de repetição na sua aplicação, uma vez que a disponibilidade pode mudar rapidamente.
Capacidade reservada
Para aplicações de produção críticas que requerem um desempenho consistente e custos previsíveis, pode usar o débito processado.
A capacidade de débito aprovisionada é uma subscrição de custo fixo que reserva uma quantidade específica de capacidade de débito para os seus modelos numa localização escolhida.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-25 UTC."],[],[],null,[]]