이 문서에서는 Gemini에 적용되는 할당량과 한도에 대해 설명합니다. 할당량에 대한 자세한 내용은 가상 프라이빗 클라우드(VPC) 할당량을 참조하세요.
할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 Google Cloud 프로젝트에서 사용할 수 있는 공유 Google Cloud 리소스의 양을 제한합니다. 따라서 할당량은 다음을 수행하는 시스템에 속합니다.
- Google Cloud 제품 및 서비스 사용 또는 소비를 모니터링합니다.
- 공정성 보장 및 사용량 급증 방지 등의 이유로 리소스 소비를 제한합니다.
- 사전 정의된 제한사항을 자동으로 적용하는 구성을 유지합니다.
- 할당량을 요청하거나 변경할 수 있는 수단을 제공합니다.
대부분의 경우 할당량이 초과되면 시스템에서 관련 Google 리소스에 대한 액세스를 즉시 차단하고 수행하려는 작업이 실패합니다. 대부분의 경우 할당량은 각 Google Cloud 프로젝트에 적용되며 해당 Google Cloud 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다.
Gemini 리소스에도 한도가 있습니다. 이 한도는 할당량 시스템과 관련이 없습니다. 별도로 명시되지 않는 한 한도를 변경할 수 없습니다.
초당 요청
Gemini는 프로젝트의 각 사용자에 대해 초당 요청에 할당량을 적용합니다.
할당량 | 값 |
---|---|
초당 요청 | 2 |
일일 요청 수
Gemini는 프로젝트의 각 사용자에 대한 일일 총 요청 수에 대한 할당량을 적용합니다.
할당량 | 값 |
---|---|
코드 생성 및 코드 완성과 같은 Gemini 코드 요청에 대한 일일 요청 수입니다. | 6000 |
Google Cloud 콘솔 및 IDE의 Gemini 창에 응답을 표시하는 채팅 및 기타 요청에 대한 일일 요청 수입니다. | 240 |
할당량 상향 조정 요청
대부분의 할당량은 Google Cloud 콘솔을 사용해 늘리거나 줄입니다. 자세한 내용은 할당량 상향 요청을 참조하세요.