서비스 | 할당량 | 측정항목 |
---|---|---|
RAG 엔진 데이터 관리 API | 60 RPM | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1,500 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1,500 RPM | Online prediction requests per base model per minute per region per base_model 지정할 수 있는 추가 필터는 base_model: textembedding-gecko 입니다. |
서비스 | 한도 | 측정항목 |
---|---|---|
동시 ImportRagFiles 요청 |
3 RPM | VertexRagService concurrent import requests per region |
ImportRagFiles 요청당 최대 파일 수 |
10,000 | VertexRagService import rag files requests per region |
비율 제한 및 할당량에 관한 자세한 내용은 Vertex AI의 생성형 AI 비율 제한을 참고하세요.
다음 단계
- Vertex AI SDK를 사용하여 Vertex AI RAG Engine 작업을 실행하는 방법은 Python용 RAG 빠른 시작을 참고하세요.
- 그라운딩에 대한 자세한 내용은 그라운딩 개요를 참고하세요.
- RAG와 그라운딩의 차이점에 대해 알아보려면 RAG를 사용하여 응답 그라운딩을 참고하세요.
- RAG 아키텍처에 대해 알아보려면 다음 단계를 따르세요.