Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressources Google Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs de Google Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud.
Le système Cloud Quotas effectue les opérations suivantes :
- Surveille votre consommation de produits et services Google Cloud
- Limite votre consommation de ces ressources
- Permet de demander des modifications de la valeur du quota
Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.
Quotas de requêtes totaux
Les quotas suivants s'appliquent aux requêtes d'IA AML :
Quota | Valeur |
---|---|
Requêtes par seconde et par projet, par région | 100 |
Requêtes par seconde, par organisation et par région | 100 |
Nombre de parties impliquées dans les demandes de
projects.locations.instances.engineConfigs.create
par jour et par projet |
55 000 000 |
Nombre de parties utilisées dans les requêtes envoyées à projects.locations.instances.engineConfigs.create par jour et par organisation |
55 000 000 |
Nombre de parties utilisées dans les requêtes envoyées à projects.locations.instances.models.create par jour et par projet |
55 000 000 |
Nombre de parties impliquées dans les demandes de
projects.locations.instances.models.create
par jour et par organisation |
55 000 000 |
Nombre de parties impliquées dans les demandes de
projects.locations.instances.backtestResults.create
multiplié par le nombre de périodes de tests backtest par jour et par projet |
55 000 000 |
Nombre de parties impliquées dans les demandes de
projects.locations.instances.backtestResults.create
multiplié par le nombre de périodes de tests backtest par jour et par organisation |
55 000 000 |
Nombre de parties enregistrées utilisées dans les demandes de
projects.locations.instances.predictionResults.create
multiplié par le nombre de périodes de prédiction par jour et par projet |
55 000 000 |
Nombre de parties enregistrées utilisées dans les requêtes envoyées à projects.locations.instances.predictionResults.create multiplié par le nombre de périodes de prédiction par jour et par organisation |
55 000 000 |
Quotas de requêtes simultanées
Les quotas suivants s'appliquent aux requêtes simultanées:
Quota | Valeur |
---|---|
Requêtes de réglage par projet et par région | 1 |
Requêtes d'entraînement par projet et par région | 5 |
Requêtes d'inférence (
projects.locations.instances.backtestResults.create
et
projects.locations.instances.predictionResults.create
combinées) par projet et par région |
5 |
Quotas de taille des collections
Les quotas suivants s'appliquent aux collections d'IA AML. Ces quotas ne sont pas réinitialisés au fil du temps, mais sont libérés lorsque vous supprimez une ressource.
Quota | Valeur |
---|---|
Instances par projet et par région | 10 |
Ensembles de données par projet et par région | 1000 |
EngineConfigs par projet et par région | 1000 |
Modèles par projet et par région | 1000 |
Limite d'allocation des parties enregistrées
Quota | Valeur |
---|---|
Parties enregistrées par projet et par région | 20 000 000 |
Demander une augmentation du quota
Pour le moment, l'AML basée sur l'IA ne permet pas d'augmenter les quotas via Google Cloud pour demander une augmentation du quota, veuillez contacter l'assistance.
Pour diminuer la plupart des quotas, utilisez la console Google Cloud. Pour plus d'informations, voir Demander un quota supérieur
Configurer des alertes de quota
Vous pouvez configurer des alertes de quota pour recevoir des notifications lorsque l'utilisation d'un quota atteint un seuil défini. Pour en savoir plus, consultez la section Configurer des alertes d'utilisation des quotas sur la page "Quotas".