このページは Cloud Translation API によって翻訳されました。

Vertex AI RAG Engine の割り当て

RAG Engine を使用して検索拡張生成（RAG）を実行するサービスごとに、次の割り当てが適用されます。割り当ては 1 分あたりのリクエスト数（RPM）で測定されます。

サービス	割り当て	指標
RAG Engine データマネジメント API	60 RPM	`VertexRagDataService requests per minute per region`
`RetrievalContexts` API	1,500 RPM	`VertexRagService retrieve requests per minute per region`
`base_model: textembedding-gecko`	1,500 RPM	`Online prediction requests per base model per minute per region per base_model` 指定できる追加のフィルタは `base_model: textembedding-gecko` です。

次の上限が適用されます。

サービス	上限	指標
同時に可能な `ImportRagFiles` リクエスト	3 RPM	`VertexRagService concurrent import requests per region`
`ImportRagFiles` リクエストあたりの最大ファイル数	10,000	`VertexRagService import rag files requests per region`

その他のレート制限と割り当てについては、Vertex AI の生成 AI のレート制限をご覧ください。

次のステップ