Questa pagina fornisce quote per i modelli ottimizzati, limiti di embedding del testo e quote per Vertex AI Agent Engine.
Quote per i modelli ottimizzati
Le seguenti quote si applicano ai modelli ottimizzati di AI generativa su Vertex AI per un determinato progetto e una determinata regione:
Quota | Valore |
---|---|
Core del pod TPU v3 per l'addestramento di immagini con limitazioni per regione * Regione supportata: europe-west4 |
64 |
GPU NVIDIA A100 80 GB per regione per l'addestramento di immagini con limitazioni * Regione supportata: us-central1 * Regione supportata: us-east4 |
8 2 |
Limiti di incorporamento di testo
Ogni richiesta di modello di embedding di testo può contenere fino a 250 testi di input (generando 1 embedding per testo di input) e 20.000 token per richiesta.
Per calcolare gli embedding vengono utilizzati solo i primi 8192 token di ogni testo di input. Ogni richiesta potrebbe includere un solo testo di input.
Limiti di Vertex AI Agent Engine
I seguenti limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione.
Descrizione | Limite |
---|---|
Creazione/eliminazione/aggiornamento di Vertex AI Agent Engine al minuto | 10 |
Query/StreamQuery Vertex AI Agent Engine al minuto | 60 |
Numero massimo di risorse Vertex AI Agent Engine | 100 |
Passaggi successivi
- Per informazioni su quote e limiti per Vertex AI, consulta Quote e limiti di Vertex AI.
- Per saperne di più su Google Cloud quote e limiti, consulta Informazioni sui valori delle quote e sui limiti di sistema.