Servizio | Quota | Metrica |
---|---|---|
API di gestione dei dati di RAG Engine | 60 giri/min | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1500 rpm | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1500 rpm | Online prediction requests per base model per minute per region per base_model Un altro filtro da specificare è base_model: textembedding-gecko |
Servizio | Limite | Metrica |
---|---|---|
Richieste ImportRagFiles simultanee |
3 RPM | VertexRagService concurrent import requests per region |
Numero massimo di file per richiesta ImportRagFiles |
10.000 | VertexRagService import rag files requests per region |
Per altri limiti di frequenza e quote, consulta Limiti di frequenza dell'IA generativa su Vertex AI.
Passaggi successivi
- Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività dell'RAG Engine di Vertex AI, consulta la guida rapida di RAG per Python.
- Per scoprire di più sul grounding, consulta la Panoramica del grounding.
- Per scoprire le differenze tra RAG e messa a terra, consulta Eseguire la messa a terra delle risposte utilizzando RAG.
- Per scoprire di più sull'architettura RAG: