Cotas e limites do modelo ajustado, da incorporação de texto e do Vertex AI Agent Engine

Nesta página, você encontra cotas de modelos ajustados, limites de embedding de texto e cotas do Vertex AI Agent Engine.

Cotas de modelos ajustados

As cotas a seguir se aplicam à IA generativa em modelos ajustados pela Vertex AI para determinado projeto e região:

Cota Valor
Núcleos do pod da TPU V3 de treinamento de imagens restritos por região
* Região compatível: europe-west4
64
Treinamento de imagens restrito: GPUs Nvidia A100 de 80 GB por região
* Região compatível: us-central1
* Região compatível: us-east4

8
2
* Os cenários de ajuste têm reservas do acelerador em regiões específicas. As cotas de ajuste são aceitas e precisam ser solicitadas em regiões específicas.

Limites de incorporação de texto

Cada solicitação de modelo de inserção de texto pode ter até 250 textos de entrada (gerando 1 inserção por texto de entrada) e 20.000 tokens por solicitação.

Apenas os primeiros 8.192 tokens em cada texto de entrada são usados para calcular as informações incorporadas. Cada solicitação pode incluir apenas um texto de entrada.

Limites do Vertex AI Agent Engine

Os limites a seguir se aplicam ao Vertex AI Agent Engine para um determinado projeto em cada região.

Descrição Limite
Criar/excluir/atualizar o Vertex AI Agent Engine por minuto 10
Motor de agente da Vertex AI Query/StreamQuery por minuto 60
Número máximo de recursos do Vertex AI Agent Engine 100

A seguir