サービス | 割り当て | 指標 |
---|---|---|
RAG Engine データ マネジメント API | 60 RPM | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1,500 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1,500 RPM | Online prediction requests per base model per minute per region per base_model 指定できる追加のフィルタは base_model: textembedding-gecko です。 |
サービス | 上限 | 指標 |
---|---|---|
同時に可能な ImportRagFiles リクエスト |
3 RPM | VertexRagService concurrent import requests per region |
ImportRagFiles リクエストあたりの最大ファイル数 |
10,000 | VertexRagService import rag files requests per region |
その他のレート制限と割り当てについては、Vertex AI の生成 AI のレート制限をご覧ください。
次のステップ
- Vertex AI SDK を使用して Vertex AI RAG Engine タスクを実行する方法については、Python の RAG クイックスタートをご覧ください。
- グラウンディングの詳細を確認する。グラウンディングの概要をご覧ください。
- RAG とグラウンディングの違いについては、RAG を使用してレスポンスをグラウンディングするをご覧ください。
- RAG アーキテクチャの詳細については、以下をご覧ください。