TPU가 적합한지 잘 모르겠다면 머신러닝 워크로드를 실행하기 위해 Compute Engine 인스턴스에서 GPU 또는 CPU를 사용해야 하는 경우를 알아보세요.
개요
GPU는 원래 컴퓨터 그래픽을 조작할 수 있도록 설계된 특수 프로세서입니다. 병렬 구조 덕분에 AI 워크로드에서 흔히 발견되는 대규모 데이터 블록을 처리하는 알고리즘에 적합합니다. 자세히 알아보기
TPU는 Google이 신경망에 맞게 설계한 애플리케이션 특정 통합 회로(ASIC)입니다. TPU에는 행렬 곱셈 단위(MXU) 및 독점 상호 연결 토폴로지와 같은 특수 기능이 있어 AI 학습 및 추론 속도를 높이는 데 적합합니다.
Cloud TPU 버전
Cloud TPU 버전 | 설명 | 사용 가능 여부 |
---|---|---|
Cloud TPU v5p | AI 모델을 학습시킬 수 있는 가장 강력한 Cloud TPU | Cloud TPU v5p는 북미(미국 동부 리전)에서 사용할 수 있습니다. |
Cloud TPU v5e | 비용 효율성, 다기능성, 확장성이 가장 뛰어난 Cloud TPU | Cloud TPU v5e는 북미(미국 서부/동부 지역)에서 정식 버전으로 제공됩니다. |
Cloud TPU v5p는 미리보기 중에 북미(us-east5)에서 사용할 수 있습니다.
Cloud TPU v5p
AI 모델을 학습시킬 수 있는 가장 강력한 Cloud TPU
Cloud TPU v5p는 북미(미국 동부 리전)에서 사용할 수 있습니다.
Cloud TPU v5e
비용 효율성, 다기능성, 확장성이 가장 뛰어난 Cloud TPU
Cloud TPU v5e는 북미(미국 서부/동부 지역)에서 정식 버전으로 제공됩니다.
Cloud TPU v5p는 미리보기 중에 북미(us-east5)에서 사용할 수 있습니다.
일반적인 용도
Cloud TPU 멀티슬라이스 학습은 수만 개의 TPU 칩에서 빠르고 쉬우며 안정적인 대규모 AI 모델 학습을 지원하는 풀 스택 기술입니다.
Cloud TPU 멀티슬라이스 학습은 수만 개의 TPU 칩에서 빠르고 쉬우며 안정적인 대규모 AI 모델 학습을 지원하는 풀 스택 기술입니다.
Cloud TPU v5e는 최신 LLM 및 생성형 AI 모델 등 다양한 AI 워크로드에 경제적인 고성능 추론을 지원합니다. TPU v5e는 Cloud TPU v4에 비해 달러당 최대 2.5배 더 높은 처리량 성능과 최대 1.7배 빠른 속도를 제공합니다. 각 TPU v5e 칩은 int8 작업을 초당 최대 393조 개까지 제공하므로 복잡한 모델에서 빠르게 예측할 수 있습니다. TPU v5e 포드는 초당 최대 100,000조 int8 작업 또는 100페타옵스의 컴퓨팅 성능을 제공합니다.
Cloud TPU v5e는 최신 LLM 및 생성형 AI 모델 등 다양한 AI 워크로드에 경제적인 고성능 추론을 지원합니다. TPU v5e는 Cloud TPU v4에 비해 달러당 최대 2.5배 더 높은 처리량 성능과 최대 1.7배 빠른 속도를 제공합니다. 각 TPU v5e 칩은 int8 작업을 초당 최대 393조 개까지 제공하므로 복잡한 모델에서 빠르게 예측할 수 있습니다. TPU v5e 포드는 초당 최대 100,000조 int8 작업 또는 100페타옵스의 컴퓨팅 성능을 제공합니다.
Cloud TPU의 성능과 GKE의 유연성과 확장성을 결합하여 이전보다 훨씬 쉽고 빠르게 머신러닝 모델을 빌드 및 배포할 수 있습니다. GKE에서 제공되는 Cloud TPU로 모든 워크로드를 위한 일관된 단일 운영 환경을 이용하여 자동화된 MLOps 파이프라인을 표준화할 수 있습니다.
Cloud TPU의 성능과 GKE의 유연성과 확장성을 결합하여 이전보다 훨씬 쉽고 빠르게 머신러닝 모델을 빌드 및 배포할 수 있습니다. GKE에서 제공되는 Cloud TPU로 모든 워크로드를 위한 일관된 단일 운영 환경을 이용하여 자동화된 MLOps 파이프라인을 표준화할 수 있습니다.
AI 모델을 개발하는 가장 간단한 방법을 원하는 고객을 위해 지연 시간이 짧은 서빙과 고성능 학습을 위해 특별히 설계된 완전 관리형 인프라 기반의 AI 모델을 빌드하기 위한 엔드 투 엔드 플랫폼인 Vertex AI로 Cloud TPU v5e를 배포할 수 있습니다.
AI 모델을 개발하는 가장 간단한 방법을 원하는 고객을 위해 지연 시간이 짧은 서빙과 고성능 학습을 위해 특별히 설계된 완전 관리형 인프라 기반의 AI 모델을 빌드하기 위한 엔드 투 엔드 플랫폼인 Vertex AI로 Cloud TPU v5e를 배포할 수 있습니다.
가격 책정
Cloud TPU 가격 책정 | 모든 Cloud TPU 가격 책정은 칩-시간 단위로 책정 | ||
---|---|---|---|
Cloud TPU 버전 | 평가판 가격(USD) | 1년 약정(USD) | 3년 약정(USD) |
Cloud TPU v5p | Starting at $4.2000 칩-시간당 | Starting at $2.9400 칩-시간당 | Starting at $1.8900 칩-시간당 |
Cloud TPU v5e | Starting at $1.2000 칩-시간당 | Starting at $0.8400 칩-시간당 | Starting at $0.5400 칩-시간당 |
Cloud TPU 가격은 제품 및 리전에 따라 다르게 책정됩니다. 자세한 내용은 여기를 참조하세요.
Cloud TPU 가격 책정
모든 Cloud TPU 가격 책정은 칩-시간 단위로 책정
Cloud TPU v5p
Starting at
$4.2000
칩-시간당
Starting at
$2.9400
칩-시간당
Starting at
$1.8900
칩-시간당
Cloud TPU v5e
Starting at
$1.2000
칩-시간당
Starting at
$0.8400
칩-시간당
Starting at
$0.5400
칩-시간당
Cloud TPU 가격은 제품 및 리전에 따라 다르게 책정됩니다. 자세한 내용은 여기를 참조하세요.