Questo documento elenca le quote e i limiti di sistema che si applicano Vertex AI Agent Builder. Le quote specificano la quantità di una risorsa condivisa conteggiabile che viene possono utilizzare e sono definite dai servizi Google Cloud come Vertex AI Agent Builder. I limiti di sistema sono valori fissi che non possono essere modificati.
Google Cloud utilizza le quote per garantire equità e ridurre dei picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di dati Risorsa Google Cloud utilizzabile dal progetto Google Cloud. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti di Google Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano anche a gestire le tue risorse Google Cloud.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di prodotti e servizi Google Cloud
- Limita il consumo di queste risorse
- Consente di richiedere modifiche al valore della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce la quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.
Esistono anche limiti di sistema per le risorse di Vertex AI Agent Builder. I limiti di sistema non possono essere modificati.
quote di allocazione
Le seguenti quote non vengono reimpostate nel tempo e vengono rilasciate quando rilascia la risorsa:
Quote | Valore |
---|---|
Numero di documenti per progetto | 1.000.000 |
Numero di documenti per organizzazione | 5.000.000 |
Numero di operazioni di importazione a lunga esecuzione in attesa per progetto | 300 |
Numero di operazioni di importazione a lunga esecuzione in attesa per organizzazione | 1500 |
Numero di operazioni di eliminazione a lunga esecuzione di documenti in sospeso per progetto | 100 |
Numero di operazioni a lunga esecuzione di documenti in attesa di eliminazione definitiva per organizzazione | 500 |
Numero di eventi utente per progetto | 40.000.000.000 |
Numero di eventi utente per organizzazione | 200.000.000.000 |
Quote per le richieste
Le seguenti quote si applicano alle richieste di Vertex AI Agent Builder:
Quote | Valore |
---|---|
Richieste di query complete al minuto per progetto | 300 |
Richieste di query complete al minuto per organizzazione | 1500 |
Richieste di lettura della ricerca di conversazione al minuto per progetto | 300 |
Richieste di lettura della ricerca conversazionale al minuto per organizzazione | 500 |
Richieste di scrittura di ricerca conversazionale al minuto per progetto | 300 |
Richieste di scrittura di ricerca conversazionale al minuto per organizzazione | 500 |
Richieste batch di documenti al minuto per progetto | 100 |
Richieste batch di documenti al minuto per organizzazione | 500 |
Richieste di lettura di documenti al minuto per progetto | 300 |
Richieste di lettura di documenti al minuto per organizzazione | 1500 |
Richieste di scrittura di documenti al minuto per progetto | 12.000 |
Richieste di scrittura di documenti al minuto per organizzazione | 60.000 |
Richieste di creazione di valutazioni al giorno per organizzazione | 5 |
Richieste di creazione valutazione al giorno per progetto | 5 |
Richieste di lettura della valutazione al minuto per organizzazione | 500 |
Richieste di lettura della valutazione al minuto per progetto | 100 |
Richieste di scrittura di valutazione al minuto per organizzazione | 500 |
Richieste di scrittura per la valutazione al minuto per progetto | 100 |
Richieste di query LLM (riepilogo della ricerca, ricerca in più passaggi) al minuto per progetto | 15 |
Richieste di query LLM (riepilogo della ricerca, ricerca in più passaggi) al minuto per organizzazione | 75 |
Numero di scritture di flussi FHIR/BQ in attesa al minuto | 6000 |
Numero di set di query di esempio per organizzazione | 500 |
Numero di set di query di esempio per progetto | 100 |
Richieste consigliate al minuto per progetto | 60.000 |
Richieste consigliate al minuto per organizzazione | Illimitato |
Richieste di lettura di query di esempio al minuto per organizzazione | 1000 |
Richieste di lettura di query di esempio al minuto per progetto | 200 |
Richieste di lettura del set di query di esempio al minuto per organizzazione | 500 |
Richieste di lettura del set di query di esempio al minuto per progetto | 100 |
Richieste di scrittura per set di query di esempio al minuto per organizzazione | 500 |
Richieste di scrittura di set di query di esempio al minuto per progetto | 100 |
Richieste di scrittura di query di esempio al minuto per organizzazione | 1000 |
Richieste di scrittura di query di esempio al minuto per progetto | 200 |
Richieste di lettura di schemi al minuto per progetto | 100 |
Richieste di lettura di schemi al minuto per organizzazione | 500 |
Richieste di scrittura di schemi al minuto per progetto | 100 |
Richieste di scrittura di schemi al minuto per organizzazione | 500 |
Richieste di ricerca al minuto per progetto | 300 |
Richieste di ricerca al minuto per organizzazione | Illimitato |
Richieste batch di eventi utente (ad esempio importazione ed eliminazione) al minuto per progetto | 100 |
Richieste batch di eventi utente (ad esempio importazione ed eliminazione) al minuto per organizzazione | 500 |
Richieste di raccolta di eventi utente al minuto per progetto per utente | 240 |
Richieste di raccolta di eventi utente al minuto per organizzazione per utente | 1200 |
Richieste di scrittura di eventi utente al minuto per progetto | 60.000 |
Richieste di scrittura di eventi utente al minuto per organizzazione | 300.000 |
Quota per l'indicizzazione delle pagine web
Quando hai un data store con l'indicizzazione avanzata dei siti web attivata, ogni pagina web indicizzata viene conteggiata ai fini della quota "Numero di documenti per progetto" nell'elenco Quote di allocazione. Puoi anche visualizzare il numero di pagine nel progetto e la quota di pagine per il progetto nel campo Pagine del progetto rispetto alla quota nella pagina Dati per un datastore.
Se aggiungi siti web a un datastore in un progetto e le pagine web al suo interno siti web causano il superamento della quota per il progetto, i siti web non indicizzati. Se nel datastore sono già presenti siti web che sono già indicizzati, i siti web continuano a essere indicizzati come prima. Puoi richiedere l'upgrade in qualsiasi momento.
Richiedi un aumento della quota
Per regolare la maggior parte delle quote, utilizza la console Google Cloud. Per ulteriori informazioni, vedi Richiedi un adeguamento della quota.