이 문서에서는 Gemini for Google Cloud에 적용되는 할당량과 시스템 한도를 설명합니다.
할당량은 사용할 수 있는 계수 가능한 공유 리소스의 양을 지정합니다. 할당량은 Gemini for Google Cloud와 같은 Google Cloud 서비스에서 정의됩니다.
시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
Gemini 리소스에도 시스템 한도가 있습니다.
한도는 변경할 수 없습니다.
초당 요청 수
Gemini for Google Cloud 는 프로젝트에 있는 각 사용자의 초당 요청에 할당량을 적용합니다.
할당량
값
초당 요청 수
2
일일 요청 수
Gemini for Google Cloud 는 프로젝트의 사용자마다 일일 요청 총개수에 대한 할당량을 적용합니다.
할당량
값
코드 생성 및 코드 완성과 같은 Gemini Code Assist 또는 BigQuery의 Gemini 코드 요청에 대한 일일 요청 수입니다.
6000
Google Cloud 콘솔 및 IDE의 Cloud Assist 패널에 응답을 표시하는 채팅, 시각화, 데이터 인사이트 표 스캔, 메타데이터 생성, 데이터 준비, 기타 요청에 대한 일일 요청 수입니다.
960
Gemini Code Assist 할당량
Gemini Code Assist는 특정 기능에 할당량을 적용합니다.
할당량
값
로컬 코드베이스 인식
토큰 컨텍스트 윈도우 128,000개
코드 맞춤설정 저장소
20,000
에이전트 모드 및 Gemini CLI 할당량
Gemini Code Assist 에이전트 모드 및 Gemini CLI의 요청 할당량이 결합됩니다. 에이전트 모드이거나 Gemini CLI를 사용하는 경우 하나의 프롬프트로 여러 요청이 발생할 수 있습니다.
할당량
Gemini Code Assist 버전
값
사용자별 분당 요청 수
Standard
120
Enterprise
120
사용자당 일일 요청 수
Standard
1500
Enterprise
2000
BigQuery의 Gemini 할당량
코드 지원 기능의 경우 코드 완성 및 코드 생성과 같은 기능에 대한 Gemini Code Assist 및 BigQuery의 Gemini 코드 요청 할당량이 동일합니다.
BigQuery 주문형 컴퓨팅 또는 Enterprise 또는 Enterprise Plus 버전과 함께 BigQuery의 Gemini를 사용하는 고객의 경우 데이터 통계와 같은 고급 기능에 대한 할당량은 스캔된 TiB의 일일 평균 사용량 또는 지난 한 달(달력 기준) 동안의 슬롯 시간에 따라 제공됩니다. 이 할당량은 조직 수준에 적용되며 조직의 모든 프로젝트에서 사용할 수 있습니다. 할당량은 가장 가까운 100개 슬롯-시간 사용량으로 반올림됩니다.
100개 슬롯-시간당 할당량(Enterprise 또는 Enterprise Plus 버전 일일 평균 사용량) 또는 주문형 컴퓨팅 모델을 사용하여 스캔된 TiB당 할당량
값
Google Cloud 콘솔의 Cloud Assist 창에 응답을 표시하는 채팅, 시각화, 테이블 스캔, 기타 요청에 대한 일일 요청 수입니다.
5
예시: 기준 슬롯이 100개인 Enterprise 버전 예약이 있는 조직에서 매일 평균 2,400개 슬롯-시간(슬롯 100개 * 24시간 = 2,400슬롯-시간)을 사용합니다. 따라서 다음 달에는 다음과 같은 일일 할당량이 적용됩니다.
일일 채팅, 시각화, 데이터 통계 표 스캔 및 자동 메타데이터 생성 120회
조직에서 아직 BigQuery Enterprise 버전, Enterprise Plus 버전 슬롯 또는 주문형 컴퓨팅(TiB)을 구매하지 않은 경우 첫 사용 후 첫 번째 전체 한 달(달력 기준) 동안 다음과 같은 기본 할당량이 제공됩니다.
일일 채팅, 시각화, 데이터 통계 표 스캔, 자동 메타데이터 생성 250회
월 중순에 주문형 컴퓨팅, Enterprise 버전 또는 Enterprise Plus 버전 예약을 사용하기 시작하면 다음 달 말일까지 기본 할당량이 적용됩니다.
할당량 상향 조정 요청
대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다.
자세한 내용은 할당량 조정 요청을 참조하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-07-17(UTC)"],[[["\u003cp\u003eGemini for Google Cloud has quotas and system limits that define the usage of shared resources, with quotas being adjustable and system limits being fixed.\u003c/p\u003e\n"],["\u003cp\u003eQuotas are applied at the project level and restrict the usage of resources, such as API calls, to ensure fairness and prevent service overload.\u003c/p\u003e\n"],["\u003cp\u003eGemini for Google Cloud enforces daily and per-second quotas on requests, such as code completion and generation, which vary depending on the request type and if Gemini Code Assist is being used, or if using Gemini in BigQuery.\u003c/p\u003e\n"],["\u003cp\u003eFor users of Gemini in BigQuery with BigQuery Enterprise Plus edition, quotas are based on the daily average use of Enterprise Plus slot-hours in the previous month, and default quotas apply initially and mid-month.\u003c/p\u003e\n"],["\u003cp\u003eQuotas can be managed and increased through the Google Cloud console, allowing users to adjust their resource allocation as needed.\u003c/p\u003e\n"]]],[],null,["# Quotas and limits\n\nThis document lists the quotas and system limits that apply to\nGemini for Google Cloud.\n\n- *Quotas* specify the amount of a countable, shared resource that you can use. Quotas are defined by Google Cloud services such as Gemini for Google Cloud.\n- *System limits* are fixed values that cannot be changed.\n\n\u003cbr /\u003e\n\nGoogle Cloud uses quotas to help ensure fairness and reduce\nspikes in resource use and availability. A quota restricts how much of a\nGoogle Cloud resource your Google Cloud project can use. Quotas\napply to a range of resource types, including hardware, software, and network\ncomponents. For example, quotas can restrict the number of API calls to a\nservice, the number of load balancers used concurrently by your project, or the\nnumber of projects that you can create. Quotas protect the community of\nGoogle Cloud users by preventing the overloading of services. Quotas also\nhelp you to manage your own Google Cloud resources.\n\nThe Cloud Quotas system does the following:\n\n- Monitors your consumption of Google Cloud products and services\n- Restricts your consumption of those resources\n- Provides a way to [request changes to the quota value](/docs/quotas/help/request_increase) and [automate quota adjustments](/docs/quotas/quota-adjuster)\n\nIn most cases, when you attempt to consume more of a resource than its quota\nallows, the system blocks access to the resource, and the task that\nyou're trying to perform fails.\n\nQuotas generally apply at the Google Cloud project\nlevel. Your use of a resource in one project doesn't affect\nyour available quota in another project. Within a Google Cloud project, quotas\nare shared across all applications and IP addresses.\n\n\nThere are also *system limits* on Gemini resources.\nSystem limits can't be changed.\n\nRequests per second\n-------------------\n\nGemini for Google Cloud enforces quotas on requests per second\nfor each user in a project.\n\nRequests per day\n----------------\n\nGemini for Google Cloud enforces quotas for the total number of\nrequests per day for each user in a project.\n\nQuotas for Gemini Code Assist\n-----------------------------\n\nGemini Code Assist enforces quotas for certain features.\n\nQuotas for agent mode and the Gemini CLI\n----------------------------------------\n\nQuotas for requests from Gemini Code Assist agent mode and the\nGemini CLI are combined. When in agent mode or when using the\nGemini CLI, one prompt might result in multiple requests.\n\nQuotas for Gemini in BigQuery\n-----------------------------\n\nFor code assistance features, the quota for Gemini Code Assist\nand Gemini in BigQuery code requests for features\nlike code completion and code generation is the same.\n\nFor customers using Gemini in BigQuery with\nBigQuery on-demand compute or with Enterprise or Enterprise Plus editions,\nthe quotas for advanced features such as data insights are provided based upon\nthe daily average use of TiB scanned or the slot-hours for the last full\ncalendar month. This quota applies to the organization level and is available to\nall projects in that organization. Quotas are rounded up to the nearest 100\nslot-hour usage.\n\n**Example**: An organization that has an Enterprise edition reservation\nwith 100 slots as its baseline will use an average of 2,400 slot-hours each\nday (100 slots \\* 24 hours = 2,400 slot-hours). As a result, in the following\nmonth they get the following daily quotas:\n\n- 120 chat, visualizations, data insights table scans and automated metadata generations per day\n\nIf your organization has not purchased any BigQuery Enterprise edition, Enterprise\nPlus edition slots, or on-demand compute (TiB) until now, then after your first usage you will receive the default quota of the following for the first full calendar month:\n\n- 250 chat, visualizations, data insights table scans, and automated metadata generations per day\n\nIf you start using on-demand compute, Enterprise edition or Enterprise Plus edition reservations mid-month, then the\ndefault quota applies until the end of the following month.\n\nRequest a quota increase\n------------------------\n\nTo adjust most quotas, use the Google Cloud console.\nFor more information, see\n[Request a quota adjustment](/docs/quotas/help/request_increase).\n\n\u003cbr /\u003e"]]