이 문서에서는 Google Cloud를 위해 Gemini에 적용되는 할당량과 시스템 한도를 설명합니다.
- 할당량은 사용할 수 있는 계수 가능한 공유 리소스의 양을 지정합니다. 할당량은 Google Cloud를 위한 Gemini와 같은 Google Cloud 서비스에서 정의합니다.
- 시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는 Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 할당량은 자체 Google Cloud 리소스를 관리하는 데도 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량 값 변경을 요청할 수 있는 수단 제공
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
Gemini 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.
초당 요청
Google Cloud를 위한 Gemini는 프로젝트에 있는 각 사용자의 초당 요청에 할당량을 적용합니다.
할당량 | 값 |
---|---|
초당 요청 | 2 |
일일 요청 수
Google Cloud를 위한 Gemini는 프로젝트의 각 사용자마다 일일 요청 총개수에 대한 할당량을 적용합니다.
할당량 | 값 |
---|---|
코드 생성 및 코드 완성과 같은 Gemini Code Assist 또는 BigQuery의 Gemini 코드 요청에 대한 일일 요청 수입니다. | 6000 |
Google Cloud 콘솔 및 IDE의 Gemini 창에 응답을 표시하는 채팅, 시각화, 데이터 통계 표 스캔, 기타 요청에 대한 일일 요청 수입니다. | 240 |
Gemini Code Assist 할당량
Gemini Code Assist는 특정 기능에 할당량을 적용합니다.
할당량 | 값 |
---|---|
로컬 코드베이스 인식 | 토큰 컨텍스트 윈도우 128,000개 |
코드 맞춤설정 저장소 | 950 |
BigQuery의 Gemini 할당량
BigQuery Enterprise Plus 버전과 함께 BigQuery의 Gemini를 사용하는 고객의 경우 지난 한 달(역일 기준) 동안의 Enterprise Plus 슬롯 시간 일일 평균 사용량을 기준으로 할당량이 제공됩니다. 이 할당량은 조직 수준에 적용되며 Enterprise Plus 버전 슬롯이 할당된 조직의 모든 프로젝트에서 사용 가능합니다. 할당량은 가장 가까운 100개 슬롯-시간 사용량으로 반올림됩니다.
100개 슬롯-시간당 할당량(Enterprise Plus 버전 일일 평균 사용량) | 값 |
---|---|
일일 코드 완성 요청 수 | 150 |
일일 코드 생성 요청 수 | 10 |
Google Cloud 콘솔의 Gemini 창에 응답을 표시하는 채팅, 시각화, 테이블 스캔, 기타 요청에 대한 일일 요청 수입니다. | 5 |
예시: 기준 슬롯이 100개인 Enterprise Plus 버전 예약이 있는 조직에서 매일 평균 2,400개 슬롯-시간(슬롯 100개 * 24시간 = 2,400슬롯-시간)을 사용합니다. 따라서 다음 달에는 다음과 같은 일일 할당량이 적용됩니다.
- 일일 코드 완성 요청 3,600회
- 일일 코드 생성 요청 240회
- 일일 채팅, 시각화, 데이터 통계 표 스캔 120회
조직에서 아직 BigQuery Enterprise Plus 버전 예약을 구매하지 않은 경우 Enterprise Plus 버전 예약을 구매한 후 첫 번째 전체 한 달(역일 기준) 동안 다음과 같은 기본 할당량이 제공됩니다.
- 일일 코드 완성 요청 7,500회
- 일일 코드 생성 요청 500회
- 일일 채팅, 시각화, 데이터 통계 테이블 스캔 250회
월 중순에 Enterprise Plus 버전 예약을 사용하기 시작하면 다음 달 말일까지 기본 할당량이 적용됩니다.
할당량 상향 조정 요청
대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다. 자세한 내용은 할당량 조정 요청을 참고하세요.