これまでで最もパワフルで高性能かつエネルギー効率に優れた TPU である Ironwood を発表します。これは、思考や推論の AI モデルを大規模に強化するように設計されています。

Cloud Tensor Processing Unit（TPU）

Google Cloud TPU で AI 開発を加速する

Cloud TPU は、トレーニングから推論に至るまで、すべての AI ワークロードのパフォーマンスと費用を最適化します。TPU は、世界クラスのデータセンターインフラストラクチャを使用して、高い信頼性、可用性、セキュリティを提供します。

TPU が適しているかどうかわからない場合は、 ML ワークロードを実行するために、どんな場面で Compute Engine インスタンスの GPU または CPU を使用できるかについて学習してください。

概要

Tensor Processing Unit（TPU）とは

Google Cloud TPU は、カスタム設計された AI アクセラレータで、AI モデルのトレーニングと推論向けに最適化されています。エージェント、コード生成、メディアコンテンツ生成、合成音声、ビジョンサービス、レコメンデーションエンジン、パーソナライズモデルなど、さまざまなユースケースに最適です。TPU は Gemini と、検索、フォト、マップなどの Google の AI 搭載アプリケーションすべてを支え、10 億人以上のユーザーにサービスを提供しています。

Cloud TPU のメリットとは

Cloud TPU は、トレーニング、微調整、推論といった幅広い AI ワークロードに対して、費用効率の高い方法でスケーリングできるように設計されています。Cloud TPU は、PyTorch、JAX、TensorFlow などの主要な AI フレームワークでワークロードを高速化する多用途性を提供します。Google Kubernetes Engine（GKE）に Cloud TPU を統合することで、大規模な AI ワークロードをシームレスにオーケストレートできます。Dynamic Workload Scheduler を利用して、同時に必要となるアクセラレータをすべてスケジュールし、ワークロードのスケーラビリティを向上させます。AI モデルを簡単に開発する方法をお探しの場合は、フルマネージド AI プラットフォームである Vertex AI で Cloud TPU を活用することもできます。

Cloud TPU を使用する場面

Cloud TPU は、大規模言語モデル（LLM）の構築などのために、多くの行列計算を行う大規模で複雑なディープラーニングモデルのトレーニング用に最適化されています。Cloud TPU は SparseCores も備えています。これは、レコメンデーションモデルのエンベディングに基づいてモデルを高速化するデータフロープロセッサです。他のユースケースとしては、タンパク質フォールディングのモデリングや創薬などの医療分野が挙げられます。

Cloud TPU と GPU の違い

GPU は、元々コンピュータのグラフィックを操作するために設計された専用プロセッサです。その並列構造は、AI ワークロードでよく見られる大量のデータブロックを処理するアルゴリズムに最適です。詳細

TPU は、Google がニューラルネットワーク用に設計したアプリケーション固有の集積回路（ASIC）です。TPU は、行列乗算ユニット（MXU）や独自の相互接続トポロジなど、AI のトレーニングと推論の高速化に最適な特殊機能を備えています。

Cloud TPU のバージョン

Cloud TPU バージョン	説明	対象
Trillium	最先端の Cloud TPU	Trillium は、北米（米国東部リージョン）、ヨーロッパ（西部リージョン）、アジア（北東部リージョン）で一般提供されます
Cloud TPU v5p	AI モデルのトレーニングに最適な Cloud TPU です。	Cloud TPU v5p は北米（米国東部リージョン）で一般提供されます
Cloud TPU v5e	トレーニングと推論のニーズに対応する汎用的な Cloud TPU	Cloud TPU v5e は、北米（米国中部/東部/南部/西部リージョン）、ヨーロッパ（西リージョン）、アジア（東南リージョン）で一般提供されます

Cloud TPU のバージョンに関する詳細情報

Trillium

説明

最先端の Cloud TPU

対象

Trillium は、北米（米国東部リージョン）、ヨーロッパ（西部リージョン）、アジア（北東部リージョン）で一般提供されます

Cloud TPU v5p

説明

AI モデルのトレーニングに最適な Cloud TPU です。

対象

Cloud TPU v5p は北米（米国東部リージョン）で一般提供されます

Cloud TPU v5e

説明

トレーニングと推論のニーズに対応する汎用的な Cloud TPU

対象

Cloud TPU v5e は、北米（米国中部/東部/南部/西部リージョン）、ヨーロッパ（西リージョン）、アジア（東南リージョン）で一般提供されます

Cloud TPU のバージョンに関する詳細情報

仕組み

Google Cloud TPU の優れた機能をぜひご覧ください。すべてが行われるデータセンターの貴重な内部も紹介します。Cloud TPU は世界最大級の AI ワークロードの実行にご利用いただいていますが、その処理能力の源はチップだけではありません。この動画では、データセンターのネットワーク、光回線スイッチ、水冷システム、生体認証セキュリティ検証など、TPU システムのコンポーネントについて説明します。

一般的な使用例

大規模な AI トレーニングワークロードの実行

モデルをスケーリングする方法

LLM のトレーニングは錬金術のように思えるかもしれませんが、モデルのパフォーマンスを理解して最適化するのに、その必要はありません。この本は、TPU で言語モデルをスケーリングする科学をわかりやすく説明することを目的としています。TPU の仕組みや相互通信の仕組み、実際のハードウェアでの LLM の動作、大規模なスケールで効率的に実行できるようにトレーニングと推論中にモデルを並列処理する方法などについて説明しています。

入門ガイド

モデルをスケーリングする方法

LLM のトレーニングは錬金術のように思えるかもしれませんが、モデルのパフォーマンスを理解して最適化するのに、その必要はありません。この本は、TPU で言語モデルをスケーリングする科学をわかりやすく説明することを目的としています。TPU の仕組みや相互通信の仕組み、実際のハードウェアでの LLM の動作、大規模なスケールで効率的に実行できるようにトレーニングと推論中にモデルを並列処理する方法などについて説明しています。

参考情報

強力かつスケーラブルで効率的な AI トレーニング

Cloud TPU によりパフォーマンスと効率が最大となり、最短時間で価値を実現できます。Cloud TPU マルチスライストレーニングにより、数千のチップまでスケールできます。ML Goodput Measurement を使用して、大規模な ML トレーニングの生産性を測定し、向上させます。大規模モデルのトレーニング用のオープンソースリファレンスデプロイである MaxText と MaxDiffusion は、すぐに使用開始できます。

基盤 AI モデルの微調整

Pytorch/XLM を使用してアプリケーションに LLM を適応させる

ユースケースを表す独自のトレーニングデータを活用して、基盤モデルを効率的に微調整します。Cloud TPU v5e では、Cloud TPU v4 と比較して、$1 あたりの LLM 微調整のパフォーマンスが最大 1.9 倍高くなっています。

参考情報

Pytorch/XLM を使用してアプリケーションに LLM を適応させる

ユースケースを表す独自のトレーニングデータを活用して、基盤モデルを効率的に微調整します。Cloud TPU v5e では、Cloud TPU v4 と比較して、$1 あたりの LLM 微調整のパフォーマンスが最大 1.9 倍高くなっています。

大規模な AI 推論ワークロードの処理

高パフォーマンスでスケーラビリティに優れた費用対効果の高い推論を実現します

JetStream と MaxDiffusion で AI 推論を加速します。JetStream は、大規模言語モデル（LLM）推論専用に設計された新しい推論エンジンです。JetStream はパフォーマンスと費用対効果の両方を大幅に向上させるソリューションであり、Google Cloud TPU での LLM の推論のスループットとレイテンシの面で強みを発揮します。MaxDiffusion は Cloud TPU 用に最適化された拡散モデル実装のセットで、高パフォーマンスな Cloud TPU 上で拡散モデルの推論が簡単に実行できるようになります。

入門ガイド

高パフォーマンスでスケーラビリティに優れた費用対効果の高い推論を実現します

JetStream と MaxDiffusion で AI 推論を加速します。JetStream は、大規模言語モデル（LLM）推論専用に設計された新しい推論エンジンです。JetStream はパフォーマンスと費用対効果の両方を大幅に向上させるソリューションであり、Google Cloud TPU での LLM の推論のスループットとレイテンシの面で強みを発揮します。MaxDiffusion は Cloud TPU 用に最適化された拡散モデル実装のセットで、高パフォーマンスな Cloud TPU 上で拡散モデルの推論が簡単に実行できるようになります。

参考情報

スケーラブルな AI インフラストラクチャで費用に対するパフォーマンスを最大化

Cloud TPU v5e では、最新の LLM や生成 AI モデルなどの幅広い AI ワークロードに対して、高性能で費用対効果の高い推論を行えます。TPU v5e では、Cloud TPU v4 と比較して、$1 あたりのスループットパフォーマンスが最大 2.5 倍、速度が最大 1.7 倍になります。TPU v5e チップごとに 1 秒あたり最大 393 兆の int8 オペレーションを行うため、複雑なモデルで素早く予測できます。TPU v5e Pod は、1 秒あたり最大 10 京の int8 オペレーション、つまり 100 petaOps の計算能力を実現します。

GKE の Cloud TPU

プラットフォームオーケストレーションにより、最適化された AI ワークロードを実行する

堅牢な AI / ML プラットフォームでは、（i）トレーニングワークロードとサービングワークロードのための GPU を大規模にサポートするインフラストラクチャオーケストレーション、（ii）分散コンピューティングとデータ処理フレームワークとの柔軟な統合、（iii）リソースを最大限に活用するための同じインフラストラクチャ上での複数チームのサポート、というレイヤが考慮されます。

GKE

入門ガイド

プラットフォームオーケストレーションにより、最適化された AI ワークロードを実行する

堅牢な AI / ML プラットフォームでは、（i）トレーニングワークロードとサービングワークロードのための GPU を大規模にサポートするインフラストラクチャオーケストレーション、（ii）分散コンピューティングとデータ処理フレームワークとの柔軟な統合、（iii）リソースを最大限に活用するための同じインフラストラクチャ上での複数チームのサポート、というレイヤが考慮されます。

GKE

参考情報

GKE による容易なスケーリング

Cloud TPU の能力と、GKE の柔軟性およびスケーラビリティを組み合わせることで、ML モデルをこれまで以上に迅速かつ簡単に構築してデプロイできます。GKE で利用できる Cloud TPU により、すべてのワークロードに対して一貫性のある単一の運用環境を構築し、自動化された MLOps パイプラインを標準化できるようになります。

Vertex AI の Cloud TPU

Cloud TPU を使用した Vertex AI のトレーニングと予測

AI モデルを簡単に開発する方法をお探しのお客様は、低レイテンシのサービス提供と高パフォーマンスのトレーニングに特化したフルマネージドインフラストラクチャ上で AI モデルを構築するためのエンドツーエンドのプラットフォームである Vertex AI を使用して、Cloud TPU v5e をデプロイできます。

参考情報

Cloud TPU を使用した Vertex AI のトレーニングと予測

AI モデルを簡単に開発する方法をお探しのお客様は、低レイテンシのサービス提供と高パフォーマンスのトレーニングに特化したフルマネージドインフラストラクチャ上で AI モデルを構築するためのエンドツーエンドのプラットフォームである Vertex AI を使用して、Cloud TPU v5e をデプロイできます。

ソリューションの生成

解決したい問題は何ですか？

What you'll get:

手順ガイド

リファレンスアーキテクチャ

利用可能な事前構築済みソリューション

このサービスは Vertex AI を使用して構築されました。ご利用いただけるのは 18 歳以上のユーザーのみです。機密情報や個人情報は入力しないでください。

料金

Cloud TPU の料金	すべての Cloud TPU の料金はチップ時間単位です
Cloud TPU バージョン	評価価格（米ドル）	1 年間のコミットメント（米ドル）	3 年間のコミットメント（米ドル）
Trillium	目安 $2.7000 チップ時間あたり	目安 $1.8900 チップ時間あたり	目安 $1.2200 チップ時間あたり
Cloud TPU v5p	目安 $4.2000 チップ時間あたり	目安 $2.9400 チップ時間あたり	目安 $1.8900 チップ時間あたり
Cloud TPU v5e	目安 $1.2000 チップ時間あたり	目安 $0.8400 チップ時間あたり	目安 $0.5400 チップ時間あたり

Cloud TPU の料金は、プロダクトとリージョンによって異なります。

Cloud TPU の料金

すべての Cloud TPU の料金はチップ時間単位です

Trillium

評価価格（米ドル）

Starting at

$2.7000

チップ時間あたり

1 年間のコミットメント（米ドル）

Starting at

$1.8900

チップ時間あたり

3 年間のコミットメント（米ドル）

Starting at

$1.2200

チップ時間あたり

Cloud TPU v5p

評価価格（米ドル）

Starting at

$4.2000

チップ時間あたり

1 年間のコミットメント（米ドル）

Starting at

$2.9400

チップ時間あたり

3 年間のコミットメント（米ドル）

Starting at

$1.8900

チップ時間あたり

Cloud TPU v5e

評価価格（米ドル）

Starting at

$1.2000

チップ時間あたり

1 年間のコミットメント（米ドル）

Starting at

$0.8400

チップ時間あたり

3 年間のコミットメント（米ドル）

Starting at

$0.5400

チップ時間あたり

Cloud TPU の料金は、プロダクトとリージョンによって異なります。

料金計算ツール

リージョン固有の料金と手数料を含む、Cloud TPU の毎月の費用を試算できます。

カスタムの見積もり

カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

Cloud Tensor Processing Unit（TPU）

Google Cloud TPU で AI 開発を加速する

プロダクトに関する情報

Tensor Processing Unit（TPU）とは

Cloud TPU のメリットとは

Cloud TPU を使用する場面

Cloud TPU と GPU の違い

大規模な AI トレーニング ワークロードの実行

モデルをスケーリングする方法

強力かつスケーラブルで効率的な AI トレーニング

入門ガイド

モデルをスケーリングする方法

参考情報

強力かつスケーラブルで効率的な AI トレーニング

基盤 AI モデルの微調整

Pytorch/XLM を使用してアプリケーションに LLM を適応させる

参考情報

Pytorch/XLM を使用してアプリケーションに LLM を適応させる

大規模な AI 推論ワークロードの処理

高パフォーマンスでスケーラビリティに優れた費用対効果の高い推論を実現します

スケーラブルな AI インフラストラクチャで費用に対するパフォーマンスを最大化

入門ガイド

高パフォーマンスでスケーラビリティに優れた費用対効果の高い推論を実現します

参考情報

スケーラブルな AI インフラストラクチャで費用に対するパフォーマンスを最大化

GKE の Cloud TPU

プラットフォーム オーケストレーションにより、最適化された AI ワークロードを実行する

GKE による容易なスケーリング

入門ガイド

プラットフォーム オーケストレーションにより、最適化された AI ワークロードを実行する

参考情報

GKE による容易なスケーリング

Vertex AI の Cloud TPU

Cloud TPU を使用した Vertex AI のトレーニングと予測

参考情報

Cloud TPU を使用した Vertex AI のトレーニングと予測

料金計算ツール

カスタムの見積もり

概念実証を開始する

Cloud TPU を無料で試す

Cloud TPU の基本的な使い方を学ぶ

Cloud TPU VM で TensorFlow を実行する

Cloud TPU VM で JAX を実行する

Cloud TPU VM で PyTorch を実行する

大規模な AI トレーニングワークロードの実行

プラットフォームオーケストレーションにより、最適化された AI ワークロードを実行する

プラットフォームオーケストレーションにより、最適化された AI ワークロードを実行する