Vertex AI RAG Engine 할당량

RAG 엔진을 사용하여 검색 증강 생성 (RAG)을 실행하는 각 서비스에는 다음 할당량이 적용되며, 할당량은 분당 요청 수 (RPM)로 측정됩니다.
서비스 할당량 측정항목
RAG 엔진 데이터 관리 API 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts API 1,500 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1,500 RPM Online prediction requests per base model per minute per region per base_model

지정할 수 있는 추가 필터는 base_model: textembedding-gecko입니다.
적용되는 요청 한도는 다음과 같습니다.
서비스 한도 측정항목
동시 ImportRagFiles 요청 3 RPM VertexRagService concurrent import requests per region
ImportRagFiles 요청당 최대 파일 수 10,000 VertexRagService import rag files requests per region

비율 제한 및 할당량에 관한 자세한 내용은 Vertex AI의 생성형 AI 비율 제한을 참고하세요.

다음 단계