Ce document liste les quotas et les limites du système qui s'appliquent Gemini pour Google Cloud. Les quotas spécifient la quantité d'une ressource partagée dénombrable que vous pouvez utiliser. Ils sont définis par des services Google Cloud tels que Gemini pour Google Cloud. Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressources Google Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs de Google Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud.
Le système Cloud Quotas effectue les opérations suivantes :
- Surveille votre consommation de produits et services Google Cloud
- Limite votre consommation de ces ressources
- Permet de demander des modifications de la valeur de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.
Des limites du système s'appliquent également aux ressources Gemini. Les limites système ne peuvent pas être modifiées.
Requêtes par seconde
Gemini pour Google Cloud applique des quotas de requêtes par seconde pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes par seconde | 2 |
Requêtes par jour
Gemini pour Google Cloud applique des quotas sur le nombre total de requêtes par jour pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes par jour pour Gemini Code Assist ou Gemini dans Requêtes de code BigQuery, telles que la génération et le code de code l'achèvement. | 6000 |
de requêtes par jour pour le chat, la visualisation, les analyses de tables d'insights sur les données et les autres demandes qui affichent les réponses dans le volet Gemini la console Google Cloud et les IDE. | 240 |
Quotas pour Gemini Code Assist
Gemini Code Assist applique des quotas à certaines fonctionnalités.
Quota | Valeur |
---|---|
Visibilité du codebase local | Fenêtre de contexte de 128 000 jetons |
Dépôts de personnalisation de code | 950 |
Quotas pour Gemini dans BigQuery
Pour les clients qui utilisent Gemini dans BigQuery avec pour l'édition BigQuery Enterprise Plus, les quotas sont fournis en fonction d'utilisation quotidienne moyenne des heures d'utilisation des emplacements Enterprise Plus pour le dernier calendrier complet mois. Ce quota s'applique au niveau de l'organisation et est disponible pour tous projets de cette organisation auxquels des emplacements en édition Enterprise Plus ont été attribués. Les quotas sont arrondis à la centaine d'emplacements-heures d'utilisation la plus proche.
Quotas pour 100 heures d'utilisation des emplacements (utilisation moyenne quotidienne de l'édition Enterprise Plus) | Valeur |
---|---|
Requêtes de saisie automatique de code par jour | 150 |
Requêtes de génération de code par jour | 10 |
Requêtes par jour pour le chat, la visualisation, l'analyse de tableaux et d'autres requêtes qui affichent des réponses dans le volet Gemini de la console Google Cloud. | 5 |
Exemple: Organisation disposant d'une édition Enterprise Plus avec 100 emplacements comme référence,utilise en moyenne 2 400 heures d'utilisation des emplacements jour (100 emplacements x 24 heures = 2 400 heures d'utilisation des emplacements). Par conséquent, le mois suivant, il reçoit les quotas quotidiens suivants :
- 3 600 requêtes de saisie automatique de code par jour
- 240 requêtes de génération de code par jour
- 120 analyses de tableaux de chat, de visualisation et d'insights sur les données par jour
Si votre organisation n'a jamais acheté de réservations pour l'édition BigQuery Enterprise Plus jusqu'à présent, vous recevrez le quota par défaut des éléments suivants pour le premier mois calendaire complet :
- 7 500 requêtes de complétion de code par jour
- 500 requêtes de génération de code par jour
- 250 analyses de table de chat, de visualisations et d'insights sur les données par jour
Si vous commencez à utiliser les réservations Enterprise Plus en milieu de mois, le quota par défaut s'applique jusqu'à la fin du mois suivant.
Demander une augmentation du quota
Pour ajuster la plupart des quotas, utilisez la console Google Cloud. Pour en savoir plus, consultez la section Demander un ajustement de quota.