Nesta página, você encontra cotas de modelos ajustados, limites de embedding de texto e cotas do Vertex AI Agent Engine.
Cotas de modelos ajustados
As cotas a seguir se aplicam à IA generativa em modelos ajustados pela Vertex AI para determinado projeto e região:
Cota | Valor |
---|---|
Núcleos do pod da TPU V3 de treinamento de imagens restritos por região * Região compatível: europe-west4 |
64 |
Treinamento de imagens restrito: GPUs Nvidia A100 de 80 GB por região * Região compatível: us-central1 * Região compatível: us-east4 |
8 2 |
Limites de incorporação de texto
Cada solicitação de modelo de inserção de texto pode ter até 250 textos de entrada (gerando 1 inserção por texto de entrada) e 20.000 tokens por solicitação.
Apenas os primeiros 8.192 tokens em cada texto de entrada são usados para calcular as informações incorporadas. Cada solicitação pode incluir apenas um texto de entrada.
Limites do Vertex AI Agent Engine
Os limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região.
Descrição | Limite |
---|---|
Criar/excluir/atualizar o Vertex AI Agent Engine por minuto | 10 |
Motor de agente da Vertex AI Query/StreamQuery por minuto | 60 |
Número máximo de recursos do Vertex AI Agent Engine | 100 |
A seguir
- Para saber mais sobre cotas e limites da Vertex AI, consulte Cotas e limites da Vertex AI.
- Para saber mais sobre Google Cloud cotas e limites, consulte Noções básicas sobre valores de cota e limites do sistema.