Ce document liste les quotas et les limites du système qui s'appliquent Vertex AI Agent Builder. Les quotas spécifient la quantité d'une ressource partagée dénombrable que vous pouvez utiliser. Ils sont définis par des services Google Cloud tels que Vertex AI Agent Builder. Les limites du système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressources Google Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs de Google Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud.
Le système Cloud Quotas effectue les opérations suivantes :
- Surveille votre consommation de produits et services Google Cloud
- Limite votre consommation de ces ressources
- Permet de demander des modifications de la valeur du quota
Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.
Des limites du système s'appliquent également aux ressources Vertex AI Agent Builder. Les limites système ne peuvent pas être modifiées.
Les quotas d'allocation
Les quotas suivants ne sont pas réinitialisés au fil du temps, mais sont libérés lorsque vous libérez la ressource :
Quotas | Valeur |
---|---|
Nombre de documents par projet | 1 000 000 |
Nombre de documents par organisation | 5 000 000 |
Nombre d'opérations d'importation de longue durée en attente par projet | 300 |
Nombre d'opérations d'importation de longue durée en attente par organisation | 1500 |
Nombre d'opérations de purge de longue durée en attente par projet | 100 |
Nombre d'opérations de longue durée de documents en attente de suppression définitive par organisation | 500 |
Nombre d'événements utilisateur par projet | 40 000 000 000 |
Nombre d'événements utilisateur par organisation | 200 000 000 000 |
Quotas de requêtes
Les quotas suivants s'appliquent aux requêtes Vertex AI Agent Builder:
Quotas | Valeur |
---|---|
Requêtes complètes par minute et par projet | 300 |
Requêtes de requêtes complètes par minute et par organisation | 1 500 |
Requêtes de lecture de la recherche conversationnelle par minute et par projet | 300 |
Requêtes de lecture de la recherche conversationnelle par minute et par organisation | 500 |
Requêtes d'écriture de recherche conversationnelle par minute et par projet | 300 |
Requêtes d'écriture de la recherche conversationnelle par minute et par organisation | 500 |
Requêtes par lot de documents par minute et par projet | 100 |
Requêtes de documents par lot par minute et par organisation | 500 |
Requêtes de lecture de documents par minute et par projet | 300 |
Requêtes de lecture de documents par minute et par organisation | 1500 |
Requêtes d'écriture de documents par minute et par projet | 12 000 |
Requêtes d'écriture de documents par minute et par organisation | 60 000 |
Requêtes de création d'évaluation par jour et par organisation | 5 |
Requêtes de création d'évaluation par jour et par projet | 5 |
Requêtes de lecture d'évaluation par minute et par organisation | 500 |
Requêtes de lecture d'évaluation par minute et par projet | 100 |
Requêtes d'écriture d'évaluation par minute et par organisation | 500 |
Requêtes d'écriture d'évaluation par minute et par projet | 100 |
Requêtes de requêtes LLM (récapitulation de la recherche, recherche multi-tours) par minute et par projet | 15 |
Requêtes de requêtes LLM (récapitulation de la recherche, recherche multitours) par minute et par organisation | 75 |
Nombre d'écritures en streaming FHIR/BQ en attente par minute | 6 000 |
Nombre d'exemples d'ensembles de requêtes par organisation | 500 |
Nombre d'exemples d'ensembles de requêtes par projet | 100 |
Requêtes de recommandation par minute et par projet | 60 000 |
Recommander le nombre de requêtes par minute et par organisation | Illimité |
Exemples de requêtes de lecture de requêtes par minute et par organisation | 1000 |
Exemples de requêtes de lecture par minute et par projet | 200 |
Exemple de requêtes de lecture par minute et par organisation | 500 |
Exemple de requêtes de lecture par minute et par projet | 100 |
Exemples de requêtes d'écriture d'ensembles de requêtes par minute et par organisation | 500 |
Exemples de requêtes d'écriture d'ensembles de requêtes par minute et par projet | 100 |
Exemples de requêtes d'écriture de requête par minute et par organisation | 1000 |
Exemples de requêtes d'écriture de requête par minute et par projet | 200 |
Requêtes de lecture de schéma par minute et par projet | 100 |
Requêtes de lecture de schéma par minute et par organisation | 500 |
Requêtes d'écriture de schéma par minute et par projet | 100 |
Requêtes d'écriture de schéma par minute et par organisation | 500 |
Requêtes de recherche par minute et par projet | 300 |
Requêtes de recherche par minute et par organisation | Illimité |
Requêtes par lot d'événements utilisateur (telles que l'importation et la suppression) par minute et par projet | 100 |
Requêtes par lot d'événements utilisateur (telles que l'importation et la suppression) par minute et par organisation | 500 |
Requêtes de collecte d'événements utilisateur par minute, par projet et par utilisateur | 240 |
Requêtes de collecte d'événements utilisateur par minute et par organisation et par utilisateur | 1200 |
Requêtes d'écriture d'événements utilisateur par minute et par projet | 60 000 |
Requêtes d'écriture d'événements utilisateur par minute et par organisation | 300 000 |
Quota pour l'indexation des pages Web
Si vous possédez un data store associé à un site Web Advanced indexation activée, chaque page Web indexée est comptabilisé dans le « Nombre de documents par projet » dans l'outil Allocation des quotas. Vous pouvez également consulter le nombre de pages de votre projet et le quota de pages de ce projet dans le champ Pages du projet par rapport au quota de la page Données d'un data store.
Si vous ajoutez des sites Web à un entrepôt de données dans un projet et que les pages Web de ces sites Web entraînent le dépassement du quota du projet, les sites Web ne sont pas indexés. Si des sites Web de votre data store sont déjà indexés, ils continuent de l'être comme auparavant. Vous pouvez demander à augmenter votre quota à tout moment.
Demander une augmentation du quota
Pour ajuster la plupart des quotas, utilisez la console Google Cloud. Pour en savoir plus, consultez la section Demander un ajustement de quota.