이 문서에서는 Vertex AI Agent Builder에 적용되는 할당량과 시스템 한도를 설명합니다. 할당량은 사용할 수 있는 계수 가능한 공유 리소스의 양을 지정하며 Vertex AI Agent Builder와 같은 Google Cloud 서비스에서 정의됩니다. 시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는 Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 할당량은 자체 Google Cloud 리소스를 관리하는 데도 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량 값 변경을 요청할 수 있는 수단 제공
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
Vertex AI Agent Builder 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.
배정 할당량
다음 할당량은 시간이 지나도 재설정되지 않으며 리소스를 해제할 때 해제됩니다.
할당량 | 값 |
---|---|
프로젝트당 문서 수 | 1,000,000 |
조직당 문서 수 | 5,000,000 |
프로젝트당 대기 중인 가져오기 장기 실행 작업 수 | 300 |
조직당 대기 중인 가져오기 장기 실행 작업 수 | 1500 |
프로젝트당 대기 중인 영구 삭제 문서 장기 실행 작업 수 | 100 |
조직당 대기 중인 영구 삭제 문서 장기 실행 작업 수 | 500 |
프로젝트당 사용자 이벤트 수 | 40,000,000,000 |
조직당 사용자 이벤트 수 | 200,000,000,000 |
요청 할당량
Vertex AI Agent Builder 요청에 적용되는 할당량은 다음과 같습니다.
할당량 | 값 |
---|---|
프로젝트별 분당 완료된 쿼리 요청 수 | 300 |
조직별 분당 완료된 쿼리 요청 수 | 1,500 |
프로젝트별 분당 대화형 검색 읽기 요청 수 | 300 |
조직별 분당 대화형 검색 읽기 요청 수 | 500 |
프로젝트별 분당 대화형 검색 쓰기 요청 수 | 300 |
조직별 분당 대화형 검색 쓰기 요청 수 | 500 |
프로젝트별 분당 문서 일괄 요청 수 | 100 |
조직별 분당 문서 일괄 요청 수 | 500 |
프로젝트별 분당 문서 읽기 요청 수 | 300 |
조직별 분당 문서 읽기 요청 수 | 1500 |
프로젝트별 분당 문서 쓰기 요청 수 | 12,000 |
조직별 분당 문서 쓰기 요청 수 | 60,000 |
조직별 일일 평가 생성 요청 수 | 5 |
프로젝트별 일일 평가 생성 요청 수 | 5 |
조직별 분당 평가 읽기 요청 수 | 500 |
프로젝트별 분당 평가 읽기 요청 수 | 100 |
조직별 분당 평가 쓰기 요청 수 | 500 |
프로젝트별 분당 평가 쓰기 요청 수 | 100 |
프로젝트별 분당 LLM 쿼리 요청 수(검색 요약, 멀티턴 검색) | 15 |
조직별 분당 LLM 쿼리 요청 수(검색 요약, 멀티턴 검색) | 75 |
분당 대기 중인 FHIR/BQ 스트리밍 쓰기 수 | 6,000 |
조직당 샘플 쿼리 세트 수 | 500 |
프로젝트당 샘플 쿼리 세트 수 | 100 |
프로젝트별 분당 추천 요청 수 | 60,000 |
조직별 분당 추천 요청 수 | 무제한 |
조직별 분당 샘플 쿼리 읽기 요청 수 | 1000 |
프로젝트별 분당 샘플 쿼리 읽기 요청 수 | 200 |
조직별 분당 샘플 쿼리 세트 읽기 요청 수 | 500 |
프로젝트별 분당 샘플 쿼리 세트 읽기 요청 수 | 100 |
조직별 분당 샘플 쿼리 세트 쓰기 요청 수 | 500 |
프로젝트별 분당 샘플 쿼리 세트 쓰기 요청 수 | 100 |
조직별 분당 샘플 쿼리 쓰기 요청 수 | 1000 |
프로젝트별 분당 샘플 쿼리 쓰기 요청 수 | 200 |
프로젝트별 분당 스키마 읽기 요청 수 | 100 |
조직별 분당 스키마 스키마 읽기 요청 수 | 500 |
프로젝트별 분당 스키마 쓰기 요청 수 | 100 |
조직별 분당 스키마 쓰기 요청 수 | 500 |
프로젝트별 분당 검색 요청 수 | 300 |
조직별 분당 검색 요청 수 | 무제한 |
프로젝트별 분당 사용자 이벤트 일괄 요청 수(예: 가져오기 및 영구 삭제) | 100 |
조직별 분당 사용자 이벤트 일괄 요청 수(예: 가져오기 및 영구 삭제) | 500 |
사용자당 프로젝트별 분당 사용자 이벤트 수집 요청 수 | 240 |
사용자당 조직별 분당 사용자 이벤트 수집 요청 수 | 1200 |
프로젝트별 분당 사용자 이벤트 쓰기 요청 수 | 60,000 |
조직별 분당 사용자 이벤트 쓰기 요청 수 | 300,000 |
웹페이지 색인 생성 할당량
고급 웹사이트 색인 생성이 사용 설정된 데이터 스토어가 있는 경우 색인을 생성하는 모든 웹페이지가 배정 할당량 목록의 '프로젝트당 문서 수' 할당량에 반영됩니다. 데이터 스토어의 데이터 페이지에 있는 프로젝트 페이지 대 할당량 필드에서 프로젝트의 페이지 수와 해당 프로젝트의 페이지 할당량을 확인할 수도 있습니다.
프로젝트의 데이터 스토어에 웹사이트를 추가했는데 해당 웹사이트의 웹페이지로 인해 프로젝트의 할당량이 초과되면 웹사이트에서 색인이 생성되지 않습니다. 데이터 스토어에 이미 색인이 생성된 웹사이트가 있는 경우 이러한 웹사이트는 이전과 같이 계속 색인이 생성됩니다. 언제든지 할당량 업그레이드를 요청할 수 있습니다.
할당량 상향 조정 요청
대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다. 자세한 내용은 할당량 조정 요청을 참고하세요.