Quotas et limites

Ce document répertorie les quotas et limites système qui s'appliquent à Vertex AI Agent Builder.

  • Les quotas spécifient la quantité d'une ressource partagée dénombrable que vous pouvez utiliser. Les quotas sont définis par des services tels que Google Cloud Vertex AI Agent Builder.
  • Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressourcesGoogle Cloud que votre Google Cloud projet peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres Google Cloud ressources.

Le système Cloud Quotas effectue les opérations suivantes :

  • Surveille votre consommation de Google Cloud produits et services
  • Limite votre consommation de ces ressources
  • Permet de demander des modifications de la valeur du quota

Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.

Des limites système s'appliquent également aux ressources Vertex AI Agent Builder. Les limites système ne peuvent pas être modifiées.

Les quotas d'allocation

Les quotas suivants ne sont pas réinitialisés au fil du temps, mais sont libérés lorsque vous libérez la ressource. Vous pouvez demander une augmentation de quota si le quota par défaut n'est pas suffisant.

Quotas Valeur
Nombre de documents par projet 1 000 000
Nombre de magasins de données par projet 100*
Nombre de moteurs par projet 100
Nombre d'opérations d'importation de longue durée en attente par projet 300
Nombre d'opérations de purge de longue durée en attente par projet 100
Nombre de commandes de diffusion par projet 1 000
Nombre de commandes de diffusion optimisée par configuration de diffusion 100
Nombre de commandes de diffusion de filtres par configuration de diffusion 100
Nombre de commandes de diffusion de redirection par configuration de diffusion 100
Nombre de contrôles de diffusion des synonymes par configuration de diffusion 100
Nombre d'événements utilisateur par projet 40 000 000 000

* En raison d'une limitation technique, le quota maximal pour les magasins de données est de 500 par projet. Si vous avez besoin de plus de magasins de données, utilisez de nouveaux projets.

En raison d'une limitation technique, le quota maximal pour les moteurs est de 500 par projet. Si vous avez besoin de plus de moteurs, utilisez de nouveaux projets.

Quotas de requêtes

Les quotas suivants s'appliquent aux requêtes de l'API Vertex AI Agent Builder. Vous pouvez demander une augmentation de quota si le quota par défaut n'est pas suffisant.

Quotas Valeur
Requêtes de requêtes complètes par minute et par projet 300
Requêtes de lecture de la recherche conversationnelle par minute et par projet 300
Requêtes d'écriture de la recherche conversationnelle par minute et par projet 300
Requêtes par lot de documents (telles que l'importation et la suppression en ligne) par minute et par projet 100
Requêtes d'importation asynchrone de documents (Cloud Storage, BigQuery, etc.) par minute et par projet 5
Requêtes de purge de documents par minute et par projet 100
Requêtes de lecture de documents par minute et par projet 300
Requêtes d'écriture de documents par minute et par projet 12 000
Requêtes de création d'évaluation par jour et par projet 5
Requêtes de lecture d'évaluation par minute et par projet 100
Requêtes d'écriture d'évaluation par minute et par projet 100
Requêtes de requêtes LLM (récapitulation de la recherche, recherche multi-tours) par minute et par projet 60
Nombre d'écritures en flux continu FHIR ou BigQuery en attente par minute 6 000
Nombre d'exemples d'ensembles de requêtes par projet 100
Classement des requêtes API par minute et par projet 500
Requêtes de recommandation par minute et par projet 60 000
Exemples de requêtes de lecture par minute et par projet 200
Exemple de requêtes de lecture par minute et par projet 100
Exemples de requêtes d'écriture par minute et par projet 100
Exemples de requêtes d'écriture par minute et par projet 200
Requêtes de lecture de schéma par minute et par projet 100
Requêtes d'écriture de schéma par minute et par projet 100
Requêtes de recherche par minute et par projet 300
Requêtes par lot d'événements utilisateur (telles que l'importation et la suppression) par minute et par projet 100
Requêtes de collecte d'événements utilisateur par minute, par projet et par utilisateur 240
Requêtes d'écriture d'événements utilisateur par minute et par projet 60 000

Quota d'indexation des pages Web

Lorsque vous disposez d'un entrepôt de données avec l'indexation avancée des sites Web activée, chaque page Web que vous indexez est comptabilisée dans le quota "Nombre de documents par projet" de la liste Quotas d'allocation. Vous pouvez également consulter le nombre de pages de votre projet et le quota de pages de ce projet dans le champ Pages du projet par rapport au quota de la page Données d'un data store.

Si vous ajoutez des sites Web à un entrepôt de données dans un projet et que les pages Web de ces sites Web entraînent le dépassement du quota du projet, les sites Web ne sont pas indexés. Si des sites Web de votre data store sont déjà indexés, ils continuent de l'être comme auparavant. Vous pouvez demander à augmenter votre quota à tout moment.

Demander une augmentation du quota

Vous allez utiliser la console Google Cloud pour ajuster la plupart des quotas. Pour en savoir plus, consultez la section Demander un ajustement de quota.