Cette page fournit des quotas de modèles affinés, des limites d'embedding textuel et des quotas du moteur d'agent Vertex AI.
Quotas de modèles réglés
Les quotas suivants s'appliquent aux modèles réglés de l'IA générative sur Vertex AI pour un projet et une région donnés:
Quota | Valeur |
---|---|
Cœurs de pods TPU V3 d'entraînement d'image restreint par région * Région compatible - europe-west4 |
64 |
GPU Nvidia A100 80 Go pour l'entraînement d'images restreint par région * Région compatible - us-central1 * Région compatible - us-east4 |
8 2 |
Limites d'embedding textuel
Chaque requête de modèle d'encapsulation de texte peut contenir jusqu'à 250 textes d'entrée (générant un encapsulage par texte d'entrée) et 20 000 jetons par requête.
Seuls les 8 192 premiers jetons de chaque texte d'entrée sont utilisés pour calculer les représentations vectorielles continues. Chaque requête ne peut inclure qu'un seul texte de saisie.
Limites du moteur d'agent Vertex AI
Les limites suivantes s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région.
Description | Limite |
---|---|
Nombre d'opérations Créer, Mettre à jour, Supprimer de Vertex AI Agent Engine par minute | 10 |
Nombre de requêtes/StreamQuery Vertex AI Agent Engine par minute | 60 |
Nombre maximal de ressources Vertex AI Agent Engine | 100 |
Étape suivante
- Pour en savoir plus sur les quotas et les limites de Vertex AI, consultez la section Quotas et limites de Vertex AI.
- Pour en savoir plus sur les Google Cloud quotas et les limites, consultez la section Comprendre les valeurs de quota et les limites du système.