コンテンツに移動
システム

AI インフラストラクチャの効率: Ironwood TPU で炭素効率が 3.7 倍向上

2026年4月20日
Keguo (Tim) Huang

Senior Data Scientist, Google

David Patterson

Google Distinguished Engineer, Google

Try Gemini Enterprise Business Edition today

The front door to AI in the workplace

Try now

※この投稿は米国時間 2026 年 4 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。

Google は、AI インフラストラクチャが環境に与える影響について透明性を確保することに尽力しており、チップの製造からデータセンターでのチップの稼働まで、チップのライフサイクル全体における排出量の指標を公開しています。このたび、Google は第 7 世代 TPU である Ironwood の指標を更新します。Ironwood は、前世代のパフォーマンス最適化 TPU である TPU v5p と比較して、コンピューティング二酸化炭素排出原単位(CCI)が約 3.7 倍改善されています1

つまり、AI が追加のコンピューティング リソースの需要を促進しているのは事実ですが、AI ハードウェアを最適化するための Google の継続的な取り組みは、AI ワークロードのエネルギー消費量と排出量の改善に役立っています。

AI アクセラレータの効率を測定: コンピューティング二酸化炭素排出原単位(CCI)

AI ワークロードの環境への影響を管理するために、Google は AI アクセラレータ ハードウェアのコンピューティング二酸化炭素排出原単位(CCI)をモニタリングしています。CCI は、An Introduction to Life-Cycle Emissions of Artificial Intelligence Hardware2 で、利用される浮動小数点演算ごとに排出される CO2 換算量(CO2e / FLOP)の推定値として定義されています。この指標は、製造、輸送、データセンターの建設に関連する体化排出量(スコープ 3)と、データセンターでのチップの運用に関連する運用排出量(スコープ 1 と 2)の両方を含めることで、チップレベルの全体像を提供します。

Ironwood のメリット: 高パフォーマンス、低フットプリント

Google の TPU CCI は、チップの世代ごとに改善され続けています。2026 年 1 月に測定された実証データによると、Ironwood は TPU v5p と比較して CCI が 3.7 倍も改善されています。これにより、TPU v4 と比較して TPU v5p の CCI が 1.2 倍向上し、Google のパフォーマンス最適化された TPU アーキテクチャの継続的な炭素効率の最適化が実証されています。

この効率性の向上は、マシンのエネルギー消費量と製造時の排出量の増加に比べて、TPU の世代間のコンピューティング パフォーマンスの向上が大きかったことによるものです。実際、TPU v5p から Ironwood までの全世代にわたるフリート全体の測定では、利用できる FLOP 数が 5 倍向上しています3。CCI の式(CO2e / FLOP)のパフォーマンス分母が排出量よりも速くスケールされるため、新しいチップごとに 1 オペレーションあたりの純炭素コストが大幅に低下します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Oan2vLj.max-1500x1500.png

図 1: 2026 年 1 月のワークロードにおいて、Google のパフォーマンス最適化 TPU コホートで測定された Ironwood の CCI 改善の加速4

Google の TPU フリートの運用効率がさらに向上

TPU CCI 指標が更新されたことで、2025 年に公開された測定値との直接比較も可能にしました。具体的には、2024 年 10 月から 2026 年 1 月にかけて、Google の汎用 TPU コホートは、以前の報告よりも効率的に動作しました。

  • TPU v5e では、15 か月間で CCI の合計が 43% 削減され、228 gCO2e / EFLOP になりました。これは、平均使用率が 72% 増加したことによるものです。

  • 第 6 世代の TPU である Trillium では、同じ期間に CCI の合計が 20% 削減され、排出原単位は 125 gCO2e / EFLOP になりました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_HRjRsFh.max-1500x1500.png

図 2: Google の汎用 TPU コホートは、2024 年 10 月から 2026 年 1 月までの同じ TPU 世代におけるデプロイ効率の向上を示しています5

これらの結果は、Google が AI インフラストラクチャの炭素効率を継続的に改善していることを示しています。AI に対する大規模な需要により、大量の電力が必要とされ、その量は増え続けていますが、Google のイノベーションにより、消費電力の単位あたりで大幅に高いコンピューティング パフォーマンスを実現できるようになりました。

エネルギーと排出量をパフォーマンスから切り離す

これらの改善は、何に起因すると考えられるでしょうか。Ironwood のハードウェアの基本性能に加え、Google のインフラストラクチャ全体にわたるソフトウェアとシステムレベルの綿密な最適化によって、CCI の向上はさらに促進されています。

  • ソフトウェアの効率(MoE): Mixture of Experts(MoE)などのスパース アーキテクチャが広く採用されることで、必要なパラメータにのみ計算がルーティングされます。これにより、モデルの容量や品質を犠牲にすることなく、推論やトレーニングのステップごとに必要なアクティブな FLOP を大幅に削減できます。

  • 低精度演算(FP8): 8 ビット浮動小数点(FP8)形式を多用することで、16 ビット形式と比較して、コンピューティング スループットを 2 倍に高め、メモリ帯域幅の要件を半分に削減しています。これは、数学演算あたりのエネルギー コストを指数関数的に削減しながら、出力品質を維持できることを示しています。

  • ワークロードのミックスとインテリジェントなスケジューリング: 高度なフリート オーケストレーションにより、インフラストラクチャ全体でワークロードのミックスが継続的にバランス調整されます。タスクをインテリジェントにスケジューリングすることで、継続的な使用率を高く保ち、デューティ サイクルを最適化し、アイドル電力消費による二酸化炭素排出量を最小限に抑えます。

Google Cloud でサステナブルにスケーリング

AI の発展には、二酸化炭素排出量を同程度に急増させることなく、指数関数的にスケールできるインフラストラクチャが必要です。TPU v5p から Ironwood で炭素効率が 3.7 倍向上したことは、ハードウェアとソフトウェアの慎重な共同設計を通じて、エネルギーと環境フットプリントの増加を最小限に抑えながら、より高いコンピューティング密度を実現できることを示しています。Ironwood の詳細と利用方法については、こちらのフォームからご登録ください。

1. 2025 年 8 月の技術レポートで公開された手法に従い、2026 年 1 月時点の Google の各世代の TPU を対象として、TPU ハードウェアのライフサイクル全体の排出量を特定時点のスナップショットとして定量化しました。この調査の機能単位は、データセンターにデプロイされた 1 台の AI コンピュータです。これには、1 つのホストトレイ(つまり、コンピューティング サーバー)に接続された 1 つ以上のアクセラレータ トレイ(TPU を含む)が含まれます。トレイ以外の周辺コンポーネント(ラック、棚、ネットワーク機器など)と補助的なコンピューティング リソースおよびストレージ リソースは、体化排出量と運用排出量の計算から除外されます。データセンターの冷却に使用される電力は、運用排出量に含まれます。ワークロード実行の電力消費に伴う運用上の排出量を推定するために、TPU フリート全体のマシン電力データを観測して 1 か月分のサンプルを用意し、Google の 2024 年のフリート全体の二酸化炭素排出原単位の平均を適用しました。製造、輸送、廃棄に由来する体化排出量を推定するために、ハードウェアのライフサイクル評価を実施しました。データセンターの建設に伴う排出量は、Google が開示した 2024 年の温室効果ガス排出量に基づき推定されました。これらの調査結果は、モデルレベルの排出量を表しているわけではありません。また、AI に関連する Google の排出を完全に定量化したものでもありません。TPU のロケーションに応じて、特定のワークロードに対応する CCI の結果が変わる可能性があります。2. この論文の共同執筆者の Ian Schneider、Hui Xu、Stephan Benecke、Parthasarathy Ranganathan、Cooper Elsworth に対して、これらの結果を可能にするために多大な協力をしてくれたことに、著者一同から感謝を申し上げたいと思います。3. この比較では、2026 年 1 月に Google のフリートにデプロイされた TPU v5p チップと Ironwood チップの間で利用される FLOPS(BF16)を考慮しています。この傾向は、v5p(459 FLOPS)と Ironwood(2,307 FLOPS)の間のピーク FLOPS(BF16)の改善と一致しています。4. GHG プロトコルは、運用排出量について 2 つの会計基準を提供しています。ここで示す結果は、カーボンフリー エネルギーの購入による影響を含む、市場ベースの排出量を考慮したものです。カーボンフリー エネルギーの購入を除外するロケーション ベースの会計では、運用 CCI はそれぞれ 793、712、195 gCO2e/EFLOP に上昇します。CCI の改善の割合は同程度で、Ironwood の体化 CCI は合計 CCI の 23% から 8% に減少します。5. さまざまな TPU 使用率で公平に比較できるように、この分析では 2025 年 8 月の技術レポートの傾向スコア加重手法を再現し、2026 年 1 月の結果を 2025 年に公開された結果と比較しています。この統計手法では、デューティ サイクルの変動を調整して、特定の期間における TPU の比較のバランスを取ります。この経験的な手法により、計算された CCI の時間的期間間の変動が小さくなり、グローバル インフラストラクチャ全体での実際のエネルギー消費量とハードウェア使用率の変動が反映されます。

- Google シニア データ サイエンティスト、Keguo(Tim)Huang

- Google 上級エンジニア、David Patterson

投稿先