TPU가 적합한지 잘 모르겠다면 머신러닝 워크로드를 실행하기 위해 Compute Engine 인스턴스에서 GPU 또는 CPU를 사용해야 하는 경우를 알아보세요.
개요
GPU는 원래 컴퓨터 그래픽을 조작할 수 있도록 설계된 특수 프로세서입니다. 병렬 구조 덕분에 AI 워크로드에서 흔히 발견되는 대규모 데이터 블록을 처리하는 알고리즘에 적합합니다. 자세히 알아보기
TPU는 Google이 신경망에 맞게 설계한 애플리케이션 특정 통합 회로(ASIC)입니다. TPU에는 행렬 곱셈 단위(MXU) 및 독점 상호 연결 토폴로지와 같은 특수 기능이 있어 AI 학습 및 추론 속도를 높이는 데 적합합니다.
Cloud TPU 버전
Cloud TPU 버전 | 설명 | 사용 가능 여부 |
---|---|---|
Cloud TPU v5e | 비용 효율성, 다기능성, 확장성이 가장 뛰어난 Cloud TPU입니다. | Cloud TPU v5e는 북미(미국 서부/동부 지역)에서 정식 버전으로 제공됩니다. |
Cloud TPU v4 | AI 모델을 학습시킬 수 있는 가장 강력한 Cloud TPU입니다. | Cloud TPUv4는 us-central2 리전에서 사용 가능합니다. |
Cloud TPU v5e는 북미(us-east5 및 us-west4)에서 정식 버전으로 제공됩니다.
Cloud TPU v5e
비용 효율성, 다기능성, 확장성이 가장 뛰어난 Cloud TPU입니다.
Cloud TPU v5e는 북미(미국 서부/동부 지역)에서 정식 버전으로 제공됩니다.
Cloud TPU v4
AI 모델을 학습시킬 수 있는 가장 강력한 Cloud TPU입니다.
Cloud TPUv4는 us-central2 리전에서 사용 가능합니다.
Cloud TPU v5e는 북미(us-east5 및 us-west4)에서 정식 버전으로 제공됩니다.
일반적인 용도
Cloud TPU 멀티슬라이스 학습은 수만 개의 TPU 칩에서 빠르고 쉬우며 안정적인 대규모 AI 모델 학습을 지원하는 풀 스택 기술입니다.
Cloud TPU 멀티슬라이스 학습은 수만 개의 TPU 칩에서 빠르고 쉬우며 안정적인 대규모 AI 모델 학습을 지원하는 풀 스택 기술입니다.
Cloud TPU v5e는 최신 LLM 및 생성형 AI 모델 등 다양한 AI 워크로드에 경제적인 고성능 추론을 지원합니다. TPU v5e는 Cloud TPU v4에 비해 달러당 최대 2.5배 더 높은 처리량 성능과 최대 1.7배 빠른 속도를 제공합니다. 각 TPU v5e 칩은 int8 작업을