Modelli ottimizzati, embedding di testo e quote e limiti di Vertex AI Agent Engine

Questa pagina fornisce quote per i modelli ottimizzati, limiti di embedding del testo e quote per Vertex AI Agent Engine.

Quote per i modelli ottimizzati

Le seguenti quote si applicano ai modelli ottimizzati di AI generativa su Vertex AI per un determinato progetto e una determinata regione:

Quota Valore
Core del pod TPU v3 per l'addestramento di immagini con limitazioni per regione
* Regione supportata: europe-west4
64
GPU NVIDIA A100 80 GB per regione per l'addestramento di immagini con limitazioni
* Regione supportata: us-central1
* Regione supportata: us-east4

8
2
* Gli scenari di ottimizzazione hanno prenotazioni di acceleratori in regioni specifiche. Le quote per l'ottimizzazione sono supportate e devono essere richieste in regioni specifiche.

Limiti di incorporamento di testo

Ogni richiesta di modello di embedding di testo può contenere fino a 250 testi di input (generando 1 embedding per testo di input) e 20.000 token per richiesta.

Per calcolare gli embedding vengono utilizzati solo i primi 8192 token di ogni testo di input. Ogni richiesta potrebbe includere un solo testo di input.

Limiti di Vertex AI Agent Engine

I seguenti limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione.

Descrizione Limite
Creazione/eliminazione/aggiornamento di Vertex AI Agent Engine al minuto 10
Query/StreamQuery Vertex AI Agent Engine al minuto 60
Numero massimo di risorse Vertex AI Agent Engine 100

Passaggi successivi