컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

Cloud TPU 가격 책정

v2v3 TPU 가격 및 할당량은 다음 두 가지 시스템으로 나뉩니다.

  • 주문형 또는 선점형 기기로 사용할 수 있는 개별 TPU 기기에는 단일 기기 TPU 유형 가격 책정이 적용됩니다. 단일 워크로드에 함께 작업하도록 단일 기기 TPU 유형을 여러 개 결합할 수 없습니다.
  • 전용 고속 네트워크를 통해 상호 연결되는 TPU 기기의 클러스터에는 TPU Pod 유형 가격이 적용됩니다. 이 TPU 유형은 평가 할당량이 있거나 1년 또는 3년 약정을 구매한 경우에만 사용할 수 있습니다.

Cloud TPU v4에서는 모든 구성이 포드 슬라이스로 구성되므로 v4 가격 책정 시스템이 하나만 있습니다.

아키텍처 세부정보와 v2, v3, v4의 차이점은 TPU 시스템 아키텍처 문서를 참조하세요.

TPU 노드가 READY 상태일 때도 Cloud TPU 요금이 누적됩니다. 결제 주기가 끝날 때마다 그 결제 주기에 해당하는 사용량과 요금이 기재된 청구서를 받게 됩니다.

Cloud TPU v4 가격 책정

Cloud TPU v4는 머신러닝을 위한 Google의 최신 커스텀 실리콘이며 이제 미리보기 버전으로 사용할 수 있습니다. Cloud TPU v2 및 v3과의 하위 호환성은 유지하지만 칩당 원시 컴퓨팅 성능이 Cloud TPU v3에 비해 2배 이상 증가합니다. 또한 각 TPU v4 칩은 단일 논리 코어를 포함하여 하나의 프로그램에서 전체 32GiB 메모리를 사용할 수 있습니다(v2의 경우 8GiB, v3의 경우 16GiB). Cloud TPU v4 Pod 슬라이스는 3D 메시 토폴로지를 사용하는 커스텀 상호 연결, v2 및 v3의 2D 메시에서 업그레이드, 그리고 4개 칩 (TPU VM 1개)부터 수천 개의 칩에 이르는 구성으로 제공됩니다.

TPU v4 포드는 동일한 그리드 내에서 매시간 90% 무탄소 에너지로 운영되는 Google의 데이터 센터인 us-central2-b에서 제공됩니다.

Cloud TPU v4 가입 양식을 사용하여 Cloud TPU v4 포드에 대해 자세히 알아보고 GA 출시 전 액세스 권한을 받으세요.

다음 표에서는 Cloud TPU v4 구성에 적용되는 가격을 보여줍니다. v4 가격은 토폴로지의 칩 수에 따라 책정됩니다. 각 칩에는 2개의 코어가 있습니다.

TPU v4 가격 책정 칩 시간당 가격 주문형 할인율
주문형 / 평가 3,220원
1년 CUD 2,030원 37%
3년 CUD 1,450원 55%
선점형 970원 70%

Cloud TPU v3 및 Cloud TPU v4 기능 및 가격 비교

Cloud TPU v3 포드 Cloud TPU v4 포드
주요 사양
칩당 최고 컴퓨팅 123테라플롭 (bf16) 275테라플롭 (bf16 또는 int8)
HBM2 용량 및 대역폭 32GiB, 900GB/초 32GiB, 1,200GB/초
측정된 최소/평균/최대 전력 123/220/262 W 90/170/192 W
TPU 포드 크기 칩 1,024개 칩 4,096개
상호 연결 토폴로지 2D 토러스 3D 토러스
포드당 최대 컴퓨팅 126페타플롭 (bf16) 1.1엑사플롭 (bf16 또는 int8)
포드당 모든 감소 대역폭 340TB/초 1.1PB/초
포드당 바이섹션 대역폭 6.4TB/초 24TB/초
칩 시간당 가격 책정
평가 $2.00 3,220원
1년 CUD (37%) $1.26 2,030원
3Y CUD (55%) $0.90 1,450원
선점형 $0.60 970원

가격 비교 참고사항

  • us-central2-b 위치에 Cloud TPU v4 Pod 가격이 나와 있습니다.
  • us-east1-d 위치에 Cloud TPU v3 포드 가격이 나와 있습니다.
  • 각 TPU v3 칩에는 2개의 코어가 있습니다. 칩당 가격은 비교 목적으로 표시됩니다.
  • CUD는 '약정 사용 할인'을 의미합니다.

v4 할당량 구매 방법

영업팀에 연락하거나 이 주문 양식을 작성합니다.

단일 기기 가격 책정

단일 기기 TPU 유형은 1초 단위로 요금이 청구되며 주문형 또는 선점형 가격으로 사용할 수 있습니다.

단일 기기 TPU 유형은 Google 데이터 센터의 다른 TPU 기기에 직접 네트워크 연결이 이루어지지 않는 독립적인 TPU 기기입니다. 워크로드에 TPU 코어와 메모리 풀이 더 필요하다면 대신 TPU Pod 유형을 사용하세요.

선점형 TPU는 Cloud TPU에서 다른 작업을 위해 리소스 액세스가 필요할 경우 언제든지 종료(선점)할 수 있는 TPU입니다. 선점형 TPU 사용 시 청구되는 요금은 일반 TPU에 비해 매우 저렴합니다. 만든 후 1분 내에 선점된 선점형 TPU에 대해서는 요금이 청구되지 않습니다.

TPU 노드는 다음 단일 기기 TPU 유형으로 구성할 수 있습니다.

USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

TPU Pod 유형 가격 책정

TPU Pod 유형을 사용하면 모두 전용 고속 네트워크에 연결된 여러 TPU 기기에 액세스할 수 있습니다. 이 TPU 유형은 단일 TPU 노드에 더욱 많은 컴퓨팅 용량과 큰 TPU 메모리 풀을 제공합니다. TPU Pod 유형을 사용하려면 다음 옵션 중 하나를 사용해 할당량을 요청해야 합니다.

  • TPU Pod 유형의 성능을 테스트할 수 있도록 평가 할당량에 대한 액세스를 요청합니다. 평가 할당량을 사용해 만드는 TPU 노드는 1초 단위로 요금이 청구되지만 주문형 TPU 기기 또는 약정 할당량을 사용해 만든 기기와 동일한 수준의 서비스가 보장되지는 않습니다. 평가 할당량은 제한된 기간 동안에만 프로젝트에서 유지됩니다.
  • 1년 또는 3년 약정을 구매하고 코어가 최대 2,048개인 TPU 노드를 만듭니다. 약정은 요금이 증분 방식으로 청구되지 않습니다. 약정을 통해 월 단위로 지속되는 계약 기간 동안 하루 중 언제든 예약된 코어에 액세스할 수 있습니다. 약정을 구매하면 TPU 리소스를 전혀 사용하지 않더라도 약정 기간 동안 매월 요금이 청구됩니다.

TPU 노드는 다음 TPU 유형으로 구성할 수 있습니다.

USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

여러 TPU 버전 및 구성별 차이점에 대해 알아보려면 TPU 시스템 아키텍처 문서를 참조하세요.

다음 단계

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불 가격 책정을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.
영업팀에 문의