Questa pagina spiega la quota condivisa dinamica (DSQ) e in che modo è diversa dal throughput pianificato.
Introduzione alla quota condivisa dinamica
La quota condivisa dinamica (DSQ) distribuisce la capacità on demand disponibile tra tutte le query elaborate dai servizi per modelli specifici. Google Cloud Questa funzionalità elimina la necessità di impostare limiti di quota e di inviare richieste di aumento della quota.
DSQ elabora le richieste di tutti i clienti verso gli stessi endpoint regionali o multi-regionali. Le quote vengono rimosse e la capacità disponibile viene distribuita a ogni progetto.
Il throughput pianificato è l'unico modo per garantire un'elevata disponibilità per la tua applicazione e ottenere livelli di servizio prevedibili per i carichi di lavoro di produzione. Per ulteriori informazioni sul throughput riservato, consulta Throughput riservato.
Modelli supportati
Questa sezione elenca i modelli che supportano la quota condivisa dinamica (DSQ), che è attivata per impostazione predefinita in questi modelli.
Modelli Google
La tabella seguente elenca i modelli (e le versioni) Google che supportano i DSQ:
Modello | Data di uscita del DQ | Stato |
---|---|---|
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001 ) |
25 febbraio 2025 | In diretta |
Gemini 2.0 Flash (gemini-2.0-flash-001 ) |
5 febbraio 2025 | In diretta |
Gemini 1.5 Flash (gemini-1.5-flash-002 ) |
24 settembre 2024 | In diretta |
Gemini 1.5 Pro (gemini-1.5-pro-002 ) |
24 settembre 2024 | In diretta |
Le quote DSQ non sono elencate nella pagina Quote e limiti di sistema della console Google Cloud.
Risolvere gli errori DSQ
Quando la capacità non è sufficiente per soddisfare la tua query, potresti ricevere un errore 429. Per risolvere gli errori che potrebbero verificarsi, consulta Codice di errore 429.
Passaggi successivi
- Per scoprire di più sui modelli Gemini che supportano i DSQ, consulta la sezione Modelli Gemini.
- Per scoprire di più su quote e limiti dell'IA generativa, consulta Limiti di frequenza dell'IA generativa su Vertex AI.
- Per scoprire di più su quote e limiti per Vertex AI, consulta Quote e limiti di Vertex AI.
- Per saperne di più su Google Cloud quote e limiti, consulta Informazioni sui valori delle quote e sui limiti di sistema.