TPU 리전 및 영역

개요

TPU 유형 간의 주요 차이점은 가격, 성능, 메모리 용량, 영역 가용성입니다.

Google Cloud는 여러 영역으로 분할되는 리전을 사용하여 실제 컴퓨팅 리소스의 지리적 위치를 정의합니다. 예를 들어 us-central1 리전은 미국 중부와 지리적으로 가까운 리전을 나타냅니다. TPU 노드를 만들 때 TPU 노드를 만들 영역을 지정합니다. 리전 및 영역 리소스에 대한 자세한 내용은 Compute Engine 전역, 리전 및 영역별 리소스 문서를 참조하세요.

다음 표에 표시된 영역에서 TPU 구성을 만들 수 있습니다.

미국

TPU 유형(v2)	TPU v2 코어	사용 가능한 영역
v2-8	8	`us-central1-b` `us-central1-c` `us-central1-f`
v2-32	32	`us-central1-a`
v2-128	128	`us-central1-a`
v2-256	256	`us-central1-a`
v2-512	512	`us-central1-a`
TPU 유형(v3)	TPU v3 코어	사용 가능한 영역
v3-8	8	`us-central1-a` `us-central1-b` `us-central1-f`
TPU 유형(v4)	TPU v4 칩	사용 가능한 영역
모든 v4 구성	슬라이스 크기에 따라 다름	`us-central2-b`
TPU 유형(v5e)	TPU v5e 칩	사용 가능한 영역
v5litepod-1	1	`us-west4-a` `us-east5-b`
v5litepod-4	4	`us-west4-a` `us-east5-b`
v5litepod-8	8	`us-west4-a` `us-east5-b`
v5litepod-16	16	`us-west4-a` `us-east5-b`
v5litepod-32	32	`us-west4-a` `us-east5-b`
v5litepod-64	64	`us-west4-a` `us-east5-b`
v5litepod-128	128	`us-west4-a` `us-east5-b`
v5litepod-256	256	`us-west4-a` `us-east5-b`
TPU 유형(v5p)	TPU v5p 칩	사용 가능한 영역
모든 v5p 구성	슬라이스 크기에 따라 다름	`us-east5-a` `us-east5-c` `us-east1-d`

유럽

TPU 유형(v2)	TPU v2 코어	사용 가능한 영역
v2-8	8	`europe-west4-a`
v2-32	32	`europe-west4-a`
v2-128	128	`europe-west4-a`
v2-256	256	`europe-west4-a`
v2-512	512	`europe-west4-a`
TPU 유형(v3)	TPU v3 코어	사용 가능한 영역
v3-8	8	`europe-west4-a`
v3-32	32	`europe-west4-a`
v3-64	64	`europe-west4-a`
v3-128	128	`europe-west4-a`
v3-256	256	`europe-west4-a`
v3-512	512	`europe-west4-a`
v3-1024	1024	`europe-west4-a`
v3-2048	2048	`europe-west4-a`
TPU 유형(v5e)	TPU v5e 칩	사용 가능한 영역
v5lite-1	1	`europe-west4-b`
v5lite-4	4	`europe-west4-b`
v5lite-8	8	`europe-west4-b`

아시아 태평양 지역

TPU 유형(v2)	TPU v2 코어	사용 가능한 영역
v2-8	8	`asia-east1-c`

칩 또는 코어 수가 더 많은 TPU 유형은 제한된 수량으로만 제공됩니다. 칩 또는 코어 수가 더 적은 TPU 유형이 제공될 가능성이 더 높습니다.

가격 및 성능 절충점 계산

사용할 TPU 유형을 결정하려면 사용 중인 애플리케이션과 유사한 모델을 학습시키기 위해 Cloud TPU 튜토리얼로 시험해볼 수 있습니다.

v2-8과 v3-8 TPU 유형에서 전체 학습을 실행하는 데 사용할 단계 중 5~10%에 해당하는 튜토리얼을 실행합니다. 각 TPU 유형에서 해당 모델의 단계 수를 실행하는 데 걸리는 시간이 결과로 나타납니다.

TPU 유형의 성능은 선형적으로 증가하므로 v2-8과 v3-8 TPU 유형에서 태스크를 실행하는 데 걸리는 시간을 알고 있으면 칩 또는 코어 수가 더 많은 더 큰 TPU 유형에서 모델을 실행했을 때 단축되는 태스크 시간을 예상할 수 있습니다.

예를 들어 v2-8 TPU 유형에서 10,000단계를 실행하는 데 60분이 걸린다면, v2-32 노드는 같은 태스크를 수행하는 데 약 15분이 걸릴 것입니다.

몇 가지 서로 다른 TPU 유형에서 모델을 학습시키는 데 걸리는 시간을 대략 알고 있는 경우 학습 시간 대비 VM/TPU 비용을 활용하면 최고의 가격과 성능 절충점을 결정하는 데 도움이 됩니다.

Cloud TPU 및 관련 Compute Engine VM의 TPU 유형별 비용 차이를 확인하려면 TPU 가격 책정 페이지를 참조하세요.

TPU 유형 지정

사용 중인 프레임워크에 관계없이 TPU를 실행할 때 accelerator-type 매개변수로 v2 또는 v3 TPU 유형을 지정합니다. TPU v4 이상에서는 AcceleratorType 또는 AcceleratorConfig를 사용하여 유형 및 크기를 지정할 수 있습니다. 자세한 내용은 TPU 버전을 참조하세요. TPU 유형 명령어는 TPU VM 또는 TPU 노드 사용 여부에 따라 다릅니다. 명령어 예시는 TPU 관리에 나와 있습니다.

다음 단계

각 리전의 TPU 가격을 확인하려면 가격 책정 페이지를 참조하세요.
시스템 아키텍처 페이지에서 TPU 아키텍처에 대해 알아보기
TPU 사용 시기를 참조하여 Cloud TPU에 매우 적합한 모델 유형 알아보기