Cloud TPU 할당량
이 문서에서는 Cloud TPU에 적용되는 할당량을 설명합니다. Cloud TPU 가격 책정에 대한 자세한 내용은 Cloud TPU 가격 책정을 참조하세요.
Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 할당량은 자체 Google Cloud 리소스를 관리하는 데도 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량 값 변경을 요청하고 할당량 조정을 자동화하는 방법을 제공합니다.
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
TPU 할당량
TPU 할당량은Google Cloud 프로젝트에서 사용할 수 있는 Cloud TPU 코어 수에 대한 제한입니다. TPU의 각 버전은 자체 할당량과 연결됩니다. 또한 각 Cloud TPU 버전 할당량은 주문형 할당량과 선점형 (또는 스팟) 할당량으로 나뉩니다.
Cloud TPU 리소스를 만들 때 기본적으로 주문형 리소스가 생성됩니다. gcloud
명령어로 리소스를 만들 때 --spot
매개변수를 사용하여 선점 리소스를 만들 수 있습니다. 자세한 내용은 TPU 리소스 관리를 참고하세요.
기본 Cloud TPU 할당량
다음 표에는 각 사용 가능한 ZONE의 주문형 및 선점 가능 할당량의 기본값이 나와 있습니다. 이 값은 프로젝트 내에서 사용할 수 있는 최대 TPU 코어 수를 지정합니다.
TPU 버전 | 기본 할당량 (코어 수) | 할당량 이름 |
---|---|---|
v6e | 코어 64개 | 영역별 프로젝트당 선점형 TPU v6e 코어 |
v5p | 코어 768개 | 영역별 프로젝트당 선점형 TPU v5p 코어 |
v5e | 코어 64개 | 영역별 프로젝트당 선점형 TPU v5 lite 포드 코어 |
v4 | 코어 0개 | 영역별 프로젝트당 선점형 TPU v4 포드 코어 |
v3 Pod | 코어 32개 | 영역별 프로젝트당 선점형 TPU v3 포드 코어 |
v3 | 코어 120개 | 영역별 프로젝트당 선점형 TPU v3 코어 |
v2 포드 | 코어 32개 | 영역별 프로젝트당 선점형 TPU v2 포드 코어 |
v2 | 코어 120개 | 영역별 프로젝트당 선점형 TPU v2 코어 |
TPU 버전 | 기본 할당량 (코어 수) | 할당량 이름 |
---|---|---|
v6e | 코어 32개 | 영역별 프로젝트당 TPU v6e 코어 |
v5p | 코어 128개 | 영역별 프로젝트당 TPU v5p 코어 |
v5e | 코어 32개 | 영역별 프로젝트당 TPU v5 lite 포드 코어 |
v4 | 코어 0개 | 영역별 프로젝트당 TPU v4 포드 코어 |
v3 pod | 코어 32개 | 영역별 프로젝트당 TPU v3 포드 코어 |
v3 | 코어 40개 | 영역별 프로젝트당 TPU v3 코어 |
v2 포드 | 코어 32개 | 영역별 프로젝트당 TPU v2 코어 |
v2 | 코어 40개 | 영역별 프로젝트당 TPU v2 포드 코어 |
추가 할당량 보기 및 요청
Google Cloud 콘솔의 할당량 페이지에서 Google Cloud 프로젝트에 할당된 할당량을 확인할 수 있습니다.
할당량 페이지에서 Cloud TPU 할당량을 추가로 요청할 수 있습니다. 늘리려는 할당량을 찾아 세로로 된 점 3개를 클릭하고 할당량 수정을 선택합니다. 자세한 내용은 할당량 한도 상향 요청을 참고하세요. 자동 승인 기준점 미만의 할당량을 요청하면 요청이 자동으로 승인됩니다.
TPU 버전 | 자동 승인 기준 | 할당량 이름 |
---|---|---|
v6e | 모든 영역: 코어 0개 | 영역별 프로젝트당 선점형 TPU v6e 코어 |
v5p | 모든 영역: 코어 0개 | 영역별 프로젝트당 선점형 TPU v5p 코어 |
v5e |
|
영역별 프로젝트당 선점형 TPU v5 lite 포드 코어 |
v4 | 모든 영역: 0개 코어 | 영역별 프로젝트당 선점형 TPU v4 포드 코어 |
v3 Pod |
|
영역별 프로젝트당 선점형 TPU v3 포드 코어 |
v3 |
|
영역별 프로젝트당 선점형 TPU v3 코어 |
v2 포드 |
|
영역별 프로젝트당 선점형 TPU v2 포드 코어 |
v2 |
|
영역별 프로젝트당 선점형 TPU v2 코어 |
TPU 버전 | 자동 승인 기준 | 할당량 이름 |
---|---|---|
v6e | 모든 영역: 0개 코어 | 영역별 프로젝트당 TPU v6e 코어 |
v5p | us-east5-a: 코어 64개 | 영역별 프로젝트당 TPU v5p 코어 |
v5e | 모든 영역: 64코어 | 영역별 프로젝트당 TPU v5 lite 포드 코어 |
v4 | 모든 영역: 코어 0개 | 영역별 프로젝트당 TPU v4 포드 코어 |
v3 pod |
|
영역별 프로젝트당 TPU v3 포드 코어 |
v3 |
|
영역별 프로젝트당 TPU v3 코어 |
v2 포드 |
|
영역별 프로젝트당 TPU v2 코어 |
v2 |
|
영역별 프로젝트당 TPU v2 포드 코어 |
할당량 요청이 승인 또는 거부되었음을 알리는 이메일이 전송됩니다. Google Cloud 서비스 할당량은 점진적으로 증가합니다. 이로 인해 여러 리전이나 리소스에 걸쳐 출시가 진행될 수 있습니다. 출시 중에 Google Cloud 콘솔 또는 Cloud Quotas API에 표시되는 할당량 값에는 출시가 완료될 때까지 새로 증가한 할당량 값이 반영되지 않습니다. 자세한 내용은 진행 중인 출시 보기를 참고하세요.