이 페이지는 Cloud Translation API를 통해 번역되었습니다.

할당량 및 한도

이 문서에서는 AI Applications에 적용되는 할당량과 시스템 한도를 설명합니다.

할당량은 사용할 수 있는 계수 가능한 공유 리소스의 양을 지정합니다. 할당량은 AI Applications와 같은 Google Cloud 서비스에서 정의합니다.
시스템 한도는 변경할 수 없는 고정 값입니다.

Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

Google Cloud 제품 및 서비스 소비량 모니터링
리소스 소비 제한
할당량 값 변경을 요청하고 할당량 조정을 자동화하는 방법을 제공합니다.

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

AI Applications 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.

배정 할당량

다음 표에는 Discovery Engine API의 할당량이 나와 있습니다. 이러한 할당량은 시간이 지나도 재설정되지 않습니다. 대신 리소스를 해제할 때 해제됩니다. 기본 할당량이 충분하지 않으면 할당량 상향 조정을 요청할 수 있습니다.

할당량	값
프로젝트당 총 데이터 스토어 수	100^*
프로젝트당 총 엔진 수	150^†
프로젝트당 대기 중인 가져오기 장기 실행 작업 수	300
프로젝트당 대기 중인 영구 삭제 문서 장기 실행 작업 수	100
프로젝트당 제공 컨트롤 수	1,000
서빙 구성당 부스트 서빙 컨트롤 수	100
서빙 구성당 필터 서빙 컨트롤 수	100
서빙 구성당 리디렉션 서빙 컨트롤 수	100
서빙 구성당 동의어 서빙 컨트롤 수	100
위치 (글로벌, 미국, EU)별 프로젝트당 리전별 데이터 스토어 수	100
위치 (글로벌, 미국, EU)별 프로젝트당 리전 문서 수	10,000,000
위치 (글로벌, 미국, EU)별 프로젝트당 엔진의 리전 수	150
위치별 프로젝트별 사용자 이벤트 수 (글로벌, 미국, EU)	40,000,000,000

^* 기술적 제한으로 인해 데이터 스토어의 최대 할당량은 프로젝트당 500개입니다. 데이터 스토어가 더 필요한 경우 새 프로젝트를 사용하세요.

^† 기술적 제한으로 인해 엔진의 최대 할당량은 프로젝트당 500개입니다. 엔진이 더 필요한 경우 새 프로젝트를 사용하세요.

비율 할당량

Discovery Engine API 요청에는 다음 할당량이 적용됩니다. 기본 할당량이 충분하지 않으면 할당량 증가를 요청할 수 있습니다.

할당량	값
프로젝트별 분당 완료된 쿼리 요청 수	300
프로젝트별 분당 대화형 검색 읽기 요청 수	300
프로젝트별 분당 대화형 검색 쓰기 요청 수	300
프로젝트별 분당 문서 일괄 요청 수 (예: 인라인 가져오기 및 영구 삭제)	100
프로젝트별 분당 문서 비동기 가져오기 (Cloud Storage, BigQuery 등) 요청 수	5
프로젝트별 분당 문서 완전 삭제 요청 수	100
프로젝트별 분당 문서 읽기 요청 수	300
프로젝트별 분당 문서 쓰기 요청 수	12,000
프로젝트별 일일 평가 생성 요청 수	5
프로젝트별 분당 평가 읽기 요청 수	100
프로젝트별 분당 평가 쓰기 요청 수	100
그라운딩된 생성 그라운딩 확인 요청 수(분당, 프로젝트별)	300
프로젝트별 분당 LLM 쿼리 요청 수(검색 요약, 멀티턴 검색)	60
분당 대기 중인 FHIR 또는 BigQuery 스트리밍 쓰기 수	6,000
프로젝트당 샘플 쿼리 세트 수	100
프로젝트별 분당 순위 API 요청 수	500
프로젝트별 분당 추천 요청 수	60,000
프로젝트별 분당 샘플 쿼리 읽기 요청 수	200
프로젝트별 분당 샘플 쿼리 세트 읽기 요청 수	100
프로젝트별 분당 샘플 쿼리 세트 쓰기 요청 수	100
프로젝트별 분당 샘플 쿼리 쓰기 요청 수	200
프로젝트별 분당 스키마 읽기 요청 수	100
프로젝트별 분당 스키마 쓰기 요청 수	100
위치 (글로벌, 미국, EU)별 프로젝트별 분당 지역 검색 요청 수	300
프로젝트별 분당 사용자 이벤트 일괄 요청 수(예: 가져오기 및 영구 삭제)	100
사용자당 프로젝트별 분당 사용자 이벤트 수집 요청 수	240
프로젝트별 분당 사용자 이벤트 쓰기 요청 수	60,000

웹페이지 색인 생성 할당량

고급 웹사이트 색인 생성이 사용 설정된 데이터 스토어가 있는 경우 색인을 생성하는 모든 웹페이지가 배정 할당량 목록의 '프로젝트당 문서 수' 할당량에 반영됩니다. 데이터 스토어의 데이터 페이지에 있는 프로젝트 페이지 대 할당량 필드에서 프로젝트의 페이지 수와 해당 프로젝트의 페이지 할당량을 확인할 수도 있습니다.

프로젝트의 데이터 스토어에 웹사이트를 추가했는데 해당 웹사이트의 웹페이지로 인해 프로젝트의 할당량이 초과되면 웹사이트에서 색인이 생성되지 않습니다. 데이터 스토어에 이미 색인이 생성된 웹사이트가 있는 경우 이러한 웹사이트는 이전과 같이 계속 색인이 생성됩니다. 언제든지 할당량 업그레이드를 요청할 수 있습니다.

할당량 상향 조정 요청

대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다. 자세한 내용은 할당량 조정 요청을 참조하세요.