할당량 및 한도

이 문서에서는 Vertex AI Agent Builder에 적용되는 할당량과 시스템 한도를 설명합니다. 할당량은 사용할 수 있는 계수 가능한 공유 리소스의 양을 지정하며 Vertex AI Agent Builder와 같은 Google Cloud 서비스에서 정의됩니다. 시스템 한도는 변경할 수 없는 고정 값입니다.

Google Cloud는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는 Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 할당량은 자체 Google Cloud 리소스를 관리하는 데도 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

  • Google Cloud 제품 및 서비스 소비량 모니터링
  • 리소스 소비 제한
  • 할당량 값 변경을 요청할 수 있는 수단 제공

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

Vertex AI Agent Builder 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.

배정 할당량

다음 할당량은 시간이 지나도 재설정되지 않으며 리소스를 해제할 때 해제됩니다.

할당량
프로젝트당 문서 수 1,000,000
조직당 문서 수 5,000,000
프로젝트당 대기 중인 가져오기 장기 실행 작업 수 300
조직당 대기 중인 가져오기 장기 실행 작업 수 1500
프로젝트당 대기 중인 영구 삭제 문서 장기 실행 작업 수 100
조직당 대기 중인 영구 삭제 문서 장기 실행 작업 수 500
프로젝트당 사용자 이벤트 수 40,000,000,000
조직당 사용자 이벤트 수 200,000,000,000

요청 할당량

Vertex AI Agent Builder 요청에 적용되는 할당량은 다음과 같습니다.

할당량
프로젝트별 분당 완료된 쿼리 요청 수 300
조직별 분당 완료된 쿼리 요청 수 1,500
프로젝트별 분당 대화형 검색 읽기 요청 수 300
조직별 분당 대화형 검색 읽기 요청 수 500
프로젝트별 분당 대화형 검색 쓰기 요청 수 300
조직별 분당 대화형 검색 쓰기 요청 수 500
프로젝트별 분당 문서 일괄 요청 수 100
조직별 분당 문서 일괄 요청 수 500
프로젝트별 분당 문서 읽기 요청 수 300
조직별 분당 문서 읽기 요청 수 1500
프로젝트별 분당 문서 쓰기 요청 수 12,000
조직별 분당 문서 쓰기 요청 수 60,000
조직별 일일 평가 생성 요청 수 5
프로젝트별 일일 평가 생성 요청 수 5
조직별 분당 평가 읽기 요청 수 500
프로젝트별 분당 평가 읽기 요청 수 100
조직별 분당 평가 쓰기 요청 수 500
프로젝트별 분당 평가 쓰기 요청 수 100
프로젝트별 분당 LLM 쿼리 요청 수(검색 요약, 멀티턴 검색) 15
조직별 분당 LLM 쿼리 요청 수(검색 요약, 멀티턴 검색) 75
분당 대기 중인 FHIR/BQ 스트리밍 쓰기 수 6,000
조직당 샘플 쿼리 세트 수 500
프로젝트당 샘플 쿼리 세트 수 100
프로젝트별 분당 순위 API 요청 수 500
프로젝트별 분당 추천 요청 수 60,000
조직별 분당 추천 요청 수 무제한
조직별 분당 샘플 쿼리 읽기 요청 수 1000
프로젝트별 분당 샘플 쿼리 읽기 요청 수 200
조직별 분당 샘플 쿼리 세트 읽기 요청 수 500
프로젝트별 분당 샘플 쿼리 세트 읽기 요청 수 100
조직별 분당 샘플 쿼리 세트 쓰기 요청 수 500
프로젝트별 분당 샘플 쿼리 세트 쓰기 요청 수 100
조직별 분당 샘플 쿼리 쓰기 요청 수 1000
프로젝트별 분당 샘플 쿼리 쓰기 요청 수 200
프로젝트별 분당 스키마 읽기 요청 수 100
조직별 분당 스키마 읽기 요청 수 500
프로젝트별 분당 스키마 쓰기 요청 수 100
조직별 분당 스키마 쓰기 요청 수 500
프로젝트별 분당 검색 요청 수 300
조직별 분당 검색 요청 수 무제한
프로젝트별 분당 사용자 이벤트 일괄 요청 수(예: 가져오기 및 영구 삭제) 100
조직별 분당 사용자 이벤트 일괄 요청 수(예: 가져오기 및 영구 삭제) 500
사용자당 프로젝트별 분당 사용자 이벤트 수집 요청 수 240
사용자당 조직별 분당 사용자 이벤트 수집 요청 수 1200
프로젝트별 분당 사용자 이벤트 쓰기 요청 수 60,000
조직별 분당 사용자 이벤트 쓰기 요청 수 300,000

웹페이지 색인 생성 할당량

고급 웹사이트 색인 생성이 사용 설정된 데이터 스토어가 있는 경우 색인을 생성하는 모든 웹페이지가 배정 할당량 목록의 '프로젝트당 문서 수' 할당량에 반영됩니다. 데이터 스토어의 데이터 페이지에 있는 프로젝트 페이지 대 할당량 필드에서 프로젝트의 페이지 수와 해당 프로젝트의 페이지 할당량을 확인할 수도 있습니다.

프로젝트의 데이터 스토어에 웹사이트를 추가했는데 해당 웹사이트의 웹페이지로 인해 프로젝트의 할당량이 초과되면 웹사이트에서 색인이 생성되지 않습니다. 데이터 스토어에 이미 색인이 생성된 웹사이트가 있는 경우 이러한 웹사이트는 이전과 같이 계속 색인이 생성됩니다. 언제든지 할당량 업그레이드를 요청할 수 있습니다.

할당량 상향 조정 요청

대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다. 자세한 내용은 할당량 조정 요청을 참고하세요.