Quota partagé dynamique

Cette page explique le quota partagé dynamique (DSQ) et en quoi il diffère du débit provisionné.

Présentation du quota partagé dynamique

Le quota partagé dynamique (DSQ) distribue la capacité à la demande disponible entre toutes les requêtes traitées par les services Google Cloud pour des modèles spécifiques. Cette fonctionnalité vous évite d'avoir à définir des limites de quota et à envoyer des demandes d'augmentation de quota.

DSQ traite les requêtes de tous les clients vers les mêmes points de terminaison régionaux ou multirégionaux. Les quotas sont supprimés, et la capacité disponible est répartie entre chaque projet.

Le débit provisionné est le seul moyen de garantir une haute disponibilité pour votre application et d'obtenir des niveaux de service prévisibles pour vos charges de travail de production. Pour en savoir plus sur le débit provisionné, consultez la section Débit provisionné.

Modèles compatibles

Cette section liste les modèles compatibles avec le quota partagé dynamique (DSQ), qui est activé par défaut dans ces modèles.

Modèles Google

Le tableau suivant présente les modèles (et versions) Google compatibles avec DSQ:

Modèle Date de sortie de la DSQ Status
Gemini 1.5 Flash (gemini-1.5-flash-002) 24 septembre 2024 En direct
Gemini 1.5 Pro (gemini-1.5-pro-002) 24 septembre 2024 En direct

Les quotas DSQ ne sont pas listés sur la page Quotas et limites du système de la console Google Cloud.

Résoudre les erreurs DSQ

Lorsque la capacité n'est pas suffisante pour traiter votre requête, vous pouvez recevoir une erreur 429. Pour résoudre les erreurs pouvant survenir, consultez la section Code d'erreur 429.

Étape suivante