Cloud TPU 가격 책정

TPU 가격 책정 및 할당량은 2가지 체계로 나뉩니다.

  • 주문형 또는 선점형 기기로 사용할 수 있는 개별 TPU 기기에는 단일 기기 TPU 유형 가격 책정이 적용됩니다. 단일 워크로드에 함께 작업하도록 단일 기기 TPU 유형을 여러 개 결합할 수 없습니다.
  • 전용 고속 네트워크를 통해 상호 연결되는 TPU 기기의 클러스터에는 TPU Pod 유형 가격 책정이 적용됩니다. 이 TPU 유형은 평가 할당량이 있거나 1년 또는 3년 약정을 구매한 경우에만 사용할 수 있습니다.

TPU 노드가 READY 상태일 때도 Cloud TPU 요금이 청구됩니다. 결제 주기가 끝날 때마다 그 결제 주기에 해당하는 사용량과 요금이 기재된 청구서를 받게 됩니다.

단일 기기 TPU 유형의 할당량을 요청하는 방법은 Cloud TPU 할당량 정책 페이지를 참조하세요.

단일 기기 가격 책정

단일 기기 TPU 유형은 1초 단위로 요금이 청구되며 주문형 또는 선점형 가격으로 사용할 수 있습니다.

단일 기기 TPU 유형은 Google 데이터 센터의 다른 TPU 기기에 직접 네트워크 연결이 이루어지지 않는 독립적인 TPU 기기입니다. 워크로드에 TPU 코어와 메모리 풀이 더 필요하다면 대신 TPU Pod 유형을 사용하세요.

선점형 TPU는 Cloud TPU에서 다른 작업을 위해 리소스 액세스가 필요할 경우 언제든지 종료(선점)할 수 있는 TPU입니다. 선점형 TPU 사용 시 청구되는 요금은 일반 TPU에 비해 매우 저렴합니다. 만든 후 1분 내에 선점된 선점형 TPU에 대해서는 요금이 청구되지 않습니다.

TPU 노드는 다음 단일 기기 TPU 유형으로 구성할 수 있습니다.

TPU Pod 유형 가격 책정

TPU Pod 유형을 사용하면 모두 전용 고속 네트워크에 연결된 여러 TPU 기기에 액세스할 수 있습니다. 이 TPU 유형은 단일 TPU 노드에 더욱 많은 컴퓨팅 용량과 큰 TPU 메모리 풀을 제공합니다. TPU Pod 유형을 사용하려면 다음 옵션 중 하나를 사용해 할당량을 요청해야 합니다.

  • TPU Pod 유형의 성능을 테스트할 수 있도록 평가 할당량에 대한 액세스를 요청합니다. 평가 할당량을 사용해 만드는 TPU 노드는 1초 단위로 요금이 청구되지만 주문형 TPU 기기 또는 약정 할당량을 사용해 만든 기기와 동일한 수준의 서비스가 보장되지는 않습니다. 평가 할당량은 제한된 기간 동안에만 프로젝트에서 유지됩니다.
  • 1년 또는 3년 약정을 구매하고 코어가 최대 2,048개인 TPU 노드를 만듭니다. 약정은 요금이 증분 방식으로 청구되지 않습니다. 약정을 통해 월 단위로 지속되는 계약 기간 동안 하루 중 언제든 예약된 코어에 액세스할 수 있습니다. 약정을 구매하면 TPU 리소스를 전혀 사용하지 않더라도 약정 기간 동안 매월 요금이 청구됩니다.

TPU 노드는 다음 TPU 유형으로 구성할 수 있습니다.

TPU 버전과 구성 간의 차이점에 대해 알아보려면 TPU 시스템 아키텍처 문서를 참조하세요.

1년 및 3년 약정 총 비용

다음 표는 다양한 TPU 약정에서 전체 기간 동안 부과되는 총 비용을 보여줍니다.

코어가 8개 이상인 TPU 유형에 대한 액세스를 요청하려면 영업 담당자에게 문의하세요.

TFRC(TensorFlow Research Cloud) 프로그램

TFRC 프로그램에 등록한 경우 일정 기간 무료로 Cloud TPU v2 및 v3에 액세스할 권한을 부여받게 됩니다. 특히 TFRC 프로그램의 경우, TPU 노드가 us-central1-f 영역에서 실행되고 있는 한 Cloud TPU 요금이 청구되지 않습니다.

가상 머신 가격 책정

TPU에 연결하려면 별도로 요금이 청구되는 가상 머신(VM)을 프로비저닝해야 합니다. VM 인스턴스의 가격 책정에 대한 자세한 내용은 Compute Engine 가격 책정을 참조하세요.

가격 계산기

Cloud TPU와 Compute Engine VM 인스턴스를 함께 사용할 때의 요금을 추정하려면 Cloud Engine 가격 계산기를 참조하세요.

가격 책정의 예

다음 예시에서는 미국 리전에서 TPU 리소스와 Compute Engine 인스턴스를 사용하는 학습 작업의 총비용을 어떻게 계산하는지 설명합니다.

머신러닝 연구원이 Compute Engine 인스턴스를 생성하여 가상 머신을 프로비저닝하고 n1-standard-2 머신 유형을 선택합니다. 그리고 TPU 리소스를 생성하고 Compute Engine 인스턴스와 TPU 리소스 모두에 10시간의 사용량을 발생시킵니다. 학습 작업의 총비용을 계산하려면 머신러닝 연구원은 다음 비용을 서로 더해야 합니다.

  • 모든 Compute Engine 인스턴스의 총비용
  • 모든 Cloud TPU 리소스의 총비용
리소스 시간당 머신별 가격(USD) 머신 수 청구된 시간 리소스별 총비용 학습 작업의 총비용
Compute Engine
n1-standard-2 인스턴스
$0.095 1 10 $0.95
Cloud TPU 리소스 $4.50 1 10 $45.00
$45.95

선점형 TPU 사용 시 가격 책정의 예시

다음 예시에서는 위와 동일한 리소스와 시간을 사용하지만 연구원이 비용 절감을 위해 선점형 TPU를 사용할 경우 총비용을 어떻게 계산하는지 설명합니다. 선점형 TPU v2에 대한 미국 요금은 시간당 $1.35로 일반 TPU v2에 청구되는 $4.50와 크게 차이가 납니다.

리소스 시간당 머신별 가격(USD) 머신 수 청구된 시간 리소스별 총비용 학습 작업의 총비용
Compute Engine
n1-standard-2 인스턴스
$0.095 1 10 $0.95
선점형 TPU $1.35 1 10 $13.50
$14.45

다음 단계