이 문서에서는 Cloud TPU에 적용되는 할당량을 설명합니다. Cloud TPU 가격 책정에 대한 자세한 내용은 Cloud TPU 가격 책정을 참조하세요.
Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.
추가 Cloud TPU 할당량은 할당량 페이지에서 요청할 수 있습니다.
늘리려는 할당량을 찾고, 세로 점 3개를 클릭하고 할당량 편집을 선택합니다. 자세한 내용은 할당량 조정 요청을 참조하세요.
자동 승인 기준점 아래로 할당량을 요청할 경우에는 요청이 자동으로 승인됩니다.
선점형 할당량
TPU 버전
자동 승인 기준점
할당량 이름
v6e
모든 영역: 0개 코어
영역별 프로젝트당 선점형 TPU v6e 코어
v5p
모든 영역: 0개 코어
영역별 프로젝트당 선점형 TPU v5p 코어
v5e
us-east5-b: 800개 코어
us-west4-a: 1600개 코어
us-west4-b: 3968개 코어
us-west1-c: 576개 코어
us-central1-a: 3264개 코어
europe-west4-a: 4032개 코어
영역별 프로젝트당 선점형 TPU v5 lite 포드 코어
v4
모든 영역: 0개 코어
영역별 프로젝트당 선점형 TPU v4 포드 코어
v3 포드
europe-west4-a: 512개 코어
us-east1-d: 320개 코어
영역별 프로젝트당 선점형 TPU v3 포드 코어
v3
us-central1-a: 64개 코어
europe-west4-a: 128개 코어
영역별 프로젝트당 선점형 TPU v3 코어
v2 포드
us-central1-a: 64개 코어
europe-west4-a: 64개 코어
영역별 프로젝트당 선점형 TPU v2 포드 코어
v2
us-central1-b: 128개 코어
us-central1-c: 64개 코어
us-central1-f: 128개 코어
europe-west4-a: 32개 코어
영역별 프로젝트당 선점형 TPU v2 코어
주문형 할당량
TPU 버전
자동 승인 기준점
할당량 이름
v6e
모든 영역: 0개 코어
영역별 프로젝트당 TPU v6e 코어
v5p
us-east5-a: 64개 코어
영역별 프로젝트당 TPU v5p 코어
v5e
모든 영역: 64개 코어
영역별 프로젝트당 TPU v5 lite 포드 코어
v4
모든 영역: 0개 코어
영역별 프로젝트당 TPU v4 포드 코어
v3 포드
europe-west4-a: 128개 코어
us-east1-d: 64개 코어
영역별 프로젝트당 TPU v3 포드 코어
v3
us-central1-a: 64개 코어
europe-west4-a: 128개 코어
영역별 프로젝트당 TPU v3 코어
v2 포드
us-central1-a: 64개 코어
europe-west4-a: 64개 코어
영역별 프로젝트당 TPU v2 포드 코어
v2
us-central1-b: 128개 코어
us-central1-c: 64개 코어
us-central1-f: 128개 코어
europe-west4-a: 32개 코어
영역별 프로젝트당 TPU v2 코어
할당량 요청 승인 또는 거부를 알리는 이메일이 수신됩니다.Google Cloud 서비스 할당량 증가는 점진적으로 수행됩니다. 이로 인해 여러 리전이나 리소스에 걸쳐 출시가 진행될 수 있습니다. 출시 중에 Google Cloud 콘솔 또는 Cloud Quotas API에 표시되는 할당량 값에는 출시가 완료될 때까지 새로 증가한 할당량 값이 반영되지 않습니다. 자세한 내용은 진행 중인 출시 보기를 참조하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[],[],null,["# Cloud TPU quotas\n================\n\nThis document lists the quotas that apply to Cloud TPU. For information\nabout Cloud TPU pricing, see [Cloud TPU pricing](/tpu/pricing).\n\nGoogle Cloud uses quotas to help ensure fairness and reduce\nspikes in resource use and availability. A quota restricts how much of a\nGoogle Cloud resource your Google Cloud project can use. Quotas\napply to a range of resource types, including hardware, software, and network\ncomponents. For example, quotas can restrict the number of API calls to a\nservice, the number of load balancers used concurrently by your project, or the\nnumber of projects that you can create. Quotas protect the community of\nGoogle Cloud users by preventing the overloading of services. Quotas also\nhelp you to manage your own Google Cloud resources.\n\nThe Cloud Quotas system does the following:\n\n- Monitors your consumption of Google Cloud products and services\n- Restricts your consumption of those resources\n- Provides a way to [request changes to the quota value](/docs/quotas/help/request_increase) and [automate quota adjustments](/docs/quotas/quota-adjuster)\n\nIn most cases, when you attempt to consume more of a resource than its quota\nallows, the system blocks access to the resource, and the task that\nyou're trying to perform fails.\n\nQuotas generally apply at the Google Cloud project\nlevel. Your use of a resource in one project doesn't affect\nyour available quota in another project. Within a Google Cloud project, quotas\nare shared across all applications and IP addresses.\n| **Important:** This document describes Cloud TPU API quota. If you are [creating TPU slices in GKE](/kubernetes-engine/docs/how-to/tpus#create-node-pool), you use Compute Engine API quota, which is a different quota. For more information about quotas you use for TPUs in GKE, see [Ensure sufficient quota](/kubernetes-engine/docs/how-to/tpus#ensure-quota)\n\nTPU quota\n---------\n\nTPU quotas are limits on the number of Cloud TPU cores you can use with a\nGoogle Cloud project. Each version of TPU is associated with its own quota. In\naddition, each Cloud TPU version quota is divided into on-demand quota and\n[preemptible](/tpu/docs/preemptible) (or spot) quota.\n| **Note:** For more information about TPU chips and TensorCores, see [TPU System\n| architecture](/tpu/docs/system-architecture-tpu-vm).\n\nWhen you create Cloud TPU resources, by default you are creating on-demand\nresources. You can create preemptible resources using the `--spot` parameter\nwhen creating resources with the `gcloud` command. For more information, see\n[Manage TPU resources](/tpu/docs/managing-tpus-tpu-vm).\n\nDefault Cloud TPU quotas\n------------------------\n\nThe following tables show default values for on-demand and preemptible quota for\neach [available zone](/tpu/docs/regions-zones). These values specify the maximum\nnumber of TPU cores you can use within your project. \n\n### Preemptible quotas\n\n### On-demand quotas\n\n| **Note:** All requests for quota in us-central2-b (currently, only TPU v4) need to be manually approved by Google. No default quota is granted. If you require quota in us-central2-b, request quota for v4 using the same process as described in the following section.\n\nView and request additional quota\n---------------------------------\n\nYou can view the quota allocated for your Google Cloud project on the\n[Quotas page in the Google Cloud console](https://console.cloud.google.com/apis/api/tpu.googleapis.com/quotas).\n\nYou can request additional Cloud TPU quota, from the [Quotas page](https://console.cloud.google.com/iam-admin/quotas).\nFind the quota you wish to increase, click the three vertical dots and choose\n**Edit quota** . For more information, see [Request a quota adjustment](/docs/quotas/view-manage#requesting_higher_quota).\nIf you request quota below the auto-approve threshold, your request will be\nautomatically approved. \n\n### Preemptible quotas\n\n### On-demand quotas\n\nYou will receive an email stating if your quota request is approved or denied.\nGoogle Cloud service quota increases take place gradually. This might result in\nongoing rollouts across different regions or resources. During the rollout, the\nquota value that appears in the Google Cloud console or Cloud Quotas API\nwon't reflect the new, increased quota value until the rollout completes. For\nmore information, see [View ongoing\nrollouts](/docs/quotas/view-ongoing-rollouts)."]]