할당량 및 한도

이 문서에서는 Gemini에 적용되는 할당량한도에 대해 설명합니다. 할당량에 대한 자세한 내용은 가상 프라이빗 클라우드(VPC) 할당량을 참조하세요.

할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 Google Cloud 프로젝트에서 사용할 수 있는 공유 Google Cloud 리소스의 양을 제한합니다. 따라서 할당량은 다음을 수행하는 시스템에 속합니다.

  • Google Cloud 제품 및 서비스 사용 또는 소비를 모니터링합니다.
  • 공정성 보장 및 사용량 급증 방지 등의 이유로 리소스 소비를 제한합니다.
  • 사전 정의된 제한사항을 자동으로 적용하는 구성을 유지합니다.
  • 할당량을 요청하거나 변경할 수 있는 수단을 제공합니다.

대부분의 경우 할당량이 초과되면 시스템에서 관련 Google 리소스에 대한 액세스를 즉시 차단하고 수행하려는 작업이 실패합니다. 대부분의 경우 할당량은 각 Google Cloud 프로젝트에 적용되며 해당 Google Cloud 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다.

Gemini 리소스에도 한도가 있습니다. 이 한도는 할당량 시스템과 관련이 없습니다. 별도로 명시되지 않는 한 한도를 변경할 수 없습니다.

초당 요청

Gemini는 프로젝트의 각 사용자에 대해 초당 요청에 할당량을 적용합니다.

할당량
초당 요청 2

일일 요청 수

Gemini는 프로젝트의 각 사용자에 대한 일일 총 요청 수에 대한 할당량을 적용합니다.

할당량
코드 생성 및 코드 완성과 같은 Gemini 코드 요청에 대한 일일 요청 수입니다. 6000
Google Cloud 콘솔 및 IDE의 Gemini 창에 응답을 표시하는 채팅 및 기타 요청에 대한 일일 요청 수입니다. 240

할당량 상향 조정 요청

대부분의 할당량은 Google Cloud 콘솔을 사용해 늘리거나 줄입니다. 자세한 내용은 할당량 상향 요청을 참조하세요.