Questa pagina spiega la quota condivisa dinamica (DSQ) e in che modo è diversa dal throughput pianificato.
Introduzione alla quota condivisa dinamica
La quota condivisa dinamica (DSQ) distribuisce la capacità on demand disponibile tra tutte le query elaborate dai servizi Google Cloud per modelli specifici. Questa funzionalità elimina la necessità di impostare limiti di quota e di inviare richieste di aumento della quota.
DSQ elabora le richieste di tutti i clienti verso gli stessi endpoint regionali o multi-regionali. Le quote vengono rimosse e la capacità disponibile viene distribuita a ogni progetto.
Il throughput pianificato è l'unico modo per garantire un'elevata disponibilità per la tua applicazione e ottenere livelli di servizio prevedibili per i carichi di lavoro di produzione. Per ulteriori informazioni sul throughput riservato, consulta Throughput riservato.
Modelli supportati
Questa sezione elenca i modelli che supportano la quota condivisa dinamica (DSQ), che è attivata per impostazione predefinita in questi modelli.
Modelli Google
La tabella seguente elenca i modelli (e le versioni) Google che supportano i DSQ:
Modello | Data di uscita del DQ | Stato |
---|---|---|
Gemini 1.5 Flash (gemini-1.5-flash-002 ) |
24 settembre 2024 | In diretta |
Gemini 1.5 Pro (gemini-1.5-pro-002 ) |
24 settembre 2024 | In diretta |
Le quote DSQ non sono elencate nella pagina Quote e limiti di sistema in Google Cloud Console.
Risolvere gli errori DSQ
Quando la capacità non è sufficiente per soddisfare la tua query, potresti ricevere un errore 429. Per risolvere gli errori che potrebbero verificarsi, consulta Codice di errore 429.
Passaggi successivi
- Per scoprire di più sui modelli Gemini che supportano DSQ, consulta Modelli Gemini.
- Per scoprire di più su quote e limiti dell'IA generativa, consulta Limiti di frequenza dell'IA generativa su Vertex AI.
- Per scoprire di più su quote e limiti per Vertex AI, consulta Quote e limiti di Vertex AI.
- Per scoprire di più sulle quote e sui limiti di Google Cloud , consulta Informazioni sui valori delle quote e sui limiti di sistema.