Ironwood Tensor Processing Unit(TPU)

Ironwood: 추론을 위해 설계된 Google Cloud의 7세대 TPU

가장 강력한 TPU로 더 큰 모델과 데이터 세트를 효율적으로 학습시키고 미세 조정하고 제공하세요.

Ironwood에 관한 자세한 정보를 요청하세요.

성

이름

회사 이메일

전화 코드

회사 전화번호

직무

회사 이름

Google에서 제공하는 Google Cloud의 뉴스, 제품 업데이트, 행사 정보, 특별 이벤트에 관한 이메일을 받아보겠습니다.

내 개인 정보가 Google 개인정보처리방침에 따라 처리된다는 점을 이해했습니다.

귀사의 인프라는 추론 시대를 위한 준비가 되었나요?

Ironwood는 Google의 가장 강력하고 성능이 우수하며 에너지 효율적인 Tensor Processing Unit(TPU)으로, 사고 및 추론 AI 모델을 대규모로 지원하도록 설계되었습니다. Google의 내부 서비스와 Google Cloud 고객을 위한 광범위한 TPU 개발 경험을 기반으로 Ironwood는 대규모 언어 모델(LLM), 전문가 망(MoE), 고급 추론 작업과 같은 모델의 연산 및 메모리 요구사항을 처리하도록 설계되었습니다. Google Cloud AI 하이퍼컴퓨터 아키텍처 내에서 학습 및 서빙 워크로드 모두를 지원합니다.

대규모 언어 모델(LLM)에 최적화: Ironwood는 LLM 및 생성형 AI 애플리케이션에 대한 증가하는 수요를 가속화하도록 특별히 설계되었습니다.
향상된 상호 연결 기술: TPU 상호 연결 기술의 개선으로 통신 속도를 높이고 지연 시간을 줄일 수 있습니다.
고성능 컴퓨팅: 다양한 추론 작업에서 상당한 성능 향상을 경험하세요.
지속 가능한 AI: Ironwood는 Google Cloud의 지속 가능성에 대한 노력을 이어가며 최적화된 에너지 효율로 뛰어난 성능을 제공합니다.

Ironwood는 향상된 컴퓨팅 밀도, 메모리 용량, 상호 연결 대역폭을 통합하여 전력 효율을 크게 향상합니다. 이러한 기능은 특히 크고 복잡한 모델이 포함된 까다로운 AI 학습 및 서빙 워크로드의 처리량을 높이고 지연 시간을 단축하도록 설계되었습니다. Ironwood TPU는 Google Cloud AI 하이퍼컴퓨터 아키텍처 내에서 작동합니다.

Cloud AI 제품은 SLA 정책을 준수하며 지연 시간이나 가용성 보장 측면에서 다른 Google Cloud 서비스와는 차이가 있을 수 있습니다.