Quotas et limites pour les modèles ajustés, l'embedding textuel et le moteur d'agent Vertex AI

Cette page fournit des quotas de modèles affinés, des limites d'embedding textuel et des quotas du moteur d'agent Vertex AI.

Quotas de modèles réglés

Les quotas suivants s'appliquent aux modèles réglés de l'IA générative sur Vertex AI pour un projet et une région donnés:

Quota Valeur
Cœurs de pods TPU V3 d'entraînement d'image restreint par région
* Région compatible - europe-west4
64
GPU Nvidia A100 80 Go pour l'entraînement d'images restreint par région
* Région compatible - us-central1
* Région compatible - us-east4

8
2
* Les scénarios de réglage comportent des réservations d'accélérateurs dans des régions spécifiques. Les quotas de réglage sont compatibles et doivent être demandés dans des régions spécifiques.

Limites d'embedding textuel

Chaque requête de modèle d'encapsulation de texte peut contenir jusqu'à 250 textes d'entrée (générant un encapsulage par texte d'entrée) et 20 000 jetons par requête.

Seuls les 8 192 premiers jetons de chaque texte d'entrée sont utilisés pour calculer les représentations vectorielles continues. Chaque requête ne peut inclure qu'un seul texte de saisie.

Limites du moteur d'agent Vertex AI

Les limites suivantes s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région.

Description Limite
Nombre d'opérations Créer, Mettre à jour, Supprimer de Vertex AI Agent Engine par minute 10
Nombre de requêtes/StreamQuery Vertex AI Agent Engine par minute 60
Nombre maximal de ressources Vertex AI Agent Engine 100

Étape suivante