Cette page a été traduite par l'API Cloud Translation.

Quotas et limites pour les modèles ajustés, l'embedding textuel et le moteur d'agent Vertex AI

Cette page fournit des quotas de modèles affinés, des limites d'embedding textuel et des quotas du moteur d'agent Vertex AI.

Quotas de modèles réglés

Les quotas suivants s'appliquent aux modèles réglés de l'IA générative sur Vertex AI pour un projet et une région donnés:

Quota	Valeur
Cœurs de pods TPU V3 d'entraînement d'image restreint par région * Région compatible - europe-west4	64
GPU Nvidia A100 80 Go pour l'entraînement d'images restreint par région * Région compatible - us-central1 * Région compatible - us-east4	8 2

* Les scénarios de réglage comportent des réservations d'accélérateurs dans des régions spécifiques. Les quotas de réglage sont compatibles et doivent être demandés dans des régions spécifiques.

Limites d'embedding textuel

Chaque requête de modèle d'encapsulation de texte peut contenir jusqu'à 250 textes d'entrée (générant un encapsulage par texte d'entrée) et 20 000 jetons par requête.

Seuls les 8 192 premiers jetons de chaque texte d'entrée sont utilisés pour calculer les représentations vectorielles continues. Chaque requête ne peut inclure qu'un seul texte de saisie.

Limites du moteur d'agent Vertex AI

Les limites suivantes s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région.

Description	Limite
Nombre d'opérations Créer, Mettre à jour, Supprimer de Vertex AI Agent Engine par minute	10
Nombre de requêtes/StreamQuery Vertex AI Agent Engine par minute	60
Nombre maximal de ressources Vertex AI Agent Engine	100

Étape suivante

Pour en savoir plus sur les quotas et les limites de Vertex AI, consultez la section Quotas et limites de Vertex AI.
Pour en savoir plus sur les Google Cloud quotas et les limites, consultez la section Comprendre les valeurs de quota et les limites du système.

Quotas et limites pour les modèles ajustés, l'embedding textuel et le moteur d'agent Vertex AI Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Quotas de modèles réglés

Limites d'embedding textuel

Limites du moteur d'agent Vertex AI

Étape suivante

Quotas et limites pour les modèles ajustés, l'embedding textuel et le moteur d'agent Vertex AI