A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
A Vertex AI oferece duas maneiras de gerenciar a capacidade de processamento dos seus modelos de IA generativa, permitindo equilibrar custo, flexibilidade e desempenho. É possível usar um modelo flexível de pagamento por uso ou reservar uma quantidade dedicada de capacidade de transferência por um preço fixo.
Pagamento por utilização
No modelo padrão de pagamento por uso, a Vertex AI usa a cota compartilhada dinâmica, que não tem um limite de uso predefinido. Em vez disso, você tem acesso a um grande pool compartilhado de recursos que são alocados dinamicamente com base na disponibilidade e na demanda em tempo real.
Esse modelo permite que suas cargas de trabalho usem mais recursos quando eles estão disponíveis.
Se você receber um erro resource exhausted (429), isso significa que o pool compartilhado está
temporariamente com alta demanda de muitos usuários ao mesmo tempo. Implemente mecanismos de nova tentativa no aplicativo, já que a disponibilidade pode mudar rapidamente.
Capacidade reservada
Para aplicativos de produção críticos que exigem desempenho consistente e custos previsíveis, use a capacidade de processamento provisionada.
A capacidade de processamento provisionada é uma assinatura de custo fixo que reserva uma
quantidade específica de capacidade de processamento para seus modelos em um local escolhido.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-12 UTC."],[],[],null,[]]