コンテンツに移動
インフラストラクチャ

ウェアハウス スケール コンピューティング、25 年の経験が導く 3 つの教訓

2025年4月18日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Screenshot_2025-03-12_at_5.46.38PM.max-1700x1700.png
Parthasarathy Ranganathan

VP, Engineering Fellow

Urs Hölzle

SVP, Cloud Infrastructure

AI とクラウド コンピューティングの需要が拡大し続けるなかで、ここで紹介する教訓はテクノロジー リーダーにとって依然として重要といえます。

Google Cloud を試す

$300 分の無料クレジットと 20 以上の無料プロダクトがある Google Cloud で構築を始めよう

無料トライアル

エディターズノート: Google は 1998 年に、すでにスケーリングに関する大きな課題に直面していました。ウェブ検索の成功には、当時の最も強力な単一コンピュータをもはるかに超える、極めて高いコンピューティング性能と膨大なストレージが必要でした。Google が採った解決策は、数千台の相互接続されたサーバーを収容し、1 台のスーパーコンピュータとして機能させる大規模なデータセンターを開発することでした。

現在、このアプローチは「ウェアハウス スケール コンピューティング」(WSC)と呼ばれています。25 年後の今、WSC はすべてのハイパースケール コンピューティングとクラウド コンピューティングのバックボーンを形成し、Gmail や YouTube から、世界中の産業界でイノベーションを推進している昨今の AI モデルまで、あらゆるものを支えています。

このマイルストーンを記念して、Google のリーダーである Parthasarathy Ranganathan と Urs Hölzle が、WSC における Google の歩みを振り返る記事を公開しました。この記事では、Google が 25 年以上にわたって劇的に規模を拡大するなかで直面した重要な技術的課題を記録し、将来にわたって有効な 10 の教訓を挙げています。ここでは、2025 年のテクノロジー リーダーとビジネス リーダーに役立つ 3 つの重要な教訓をご紹介します。

3 つの重要な教訓

ローンチよりもランディング

WSC において最も有益な教訓の一つは、サーバーやソフトウェアではなく、成功を測定する方法に関するものです。多くの場合、組織はローンチ、つまり製品の大々的なリリースや発表に注力します。しかし、最も重要なのはランディング、つまりユーザーや顧客への具体的かつ測定可能な効果です。

新しい製品やテクノロジーをランディングさせる意味に注目することが、とても重要です。ランディング指標の選択は簡単ではありません。しかし、強引にでも早い段階で決めることが成功の鍵となります。ランディングはプロジェクトの「目的」です。

WSC がますます複雑化し、拡大するなか、適切な目標を選択し、それを適切に測定することの重要性が、より明確になりました。WSC の設計をイテレーションするなかで、リーダーはパフォーマンス、費用対効果、信頼性、管理性、セキュリティのニーズを統合する必要がありました。優先事項が多いと、チームは重要な成果よりも、ローンチそのものに気を取られがちになります。明確に定義された成果、すなわち着地点を中心としてチームを導くことで、チームは変化する技術環境に継続的に適応できます。

ルーフショットの効果

10 倍の成果を達成する方法について技術者に尋ねると、野心的な「ムーンショット」を挙げるかもしれません。つまり、抜本的な再構築でパフォーマンスを飛躍的に向上させる方法です。Google は、自動運転車(Waymo)、インターネット接続を提供する気球(Loon)、配送ドローン(Wing)など、野心的なムーンショット プロジェクトで知られています。こうした取り組みは、イノベーションを推進し、技術の限界を押し広げようとする Google の取り組みを反映しています。ムーンショットにはその役割があります。しかし、無視できないもう一つの強力なアプローチとして、ルーフショットがあります。

過去 25 年間で、Google は数多くの改善を達成してきましたが、その多くは、より小さな 1.3 ~ 2 倍程度の比較的小さな可能性を根気強く継続的に追求する、いわゆる「ルーフショット」の結果です。一連のルーフショットの取り組みによって、迅速なリターンと持続的な変革という両方の成果が得られます。

これは継続的かつ段階的な進歩を重視する考え方です。高い目標に向かって、一歩ずつ着実に進むものです。ルーフショットにより、Google はエネルギー効率、サーバー利用率、費用削減などの領域で目覚ましい成果を達成しました。これらの進歩が時間とともに積み重なり、WSC の性能を完全に再定義しました。Luiz Barroso が生前に語っていたように、「ルーフを目指すのは、そこが魅力的だからではなく、すぐそこにあるから」なのです。

セキュリティの重要性

Google が WSC の取り組みから得た最も喫緊の教訓は、セキュリティの絶対的な重要性です。WSC はグローバルなテクノロジー インフラストラクチャの基盤要素になっているため、ますます巧妙化する攻撃者の執拗な攻撃に常にさらされています。

国家レベルの攻撃を防ぐには、より高度な防御が必要不可欠です。サーバーは、ファームウェアとオペレーティング システムを検証して保護するために、個別の安全なシリコン ルート オブ トラストが必要です。すべてのデータは暗号化されなければならず、システムはゼロトラストを前提とし、重要な操作やアクセスには多要素認証が求められます。すべての本番環境コードはレビューされ、検証可能な来歴を持つべきです。防御(物理的なセキュリティを含む)は、高度なスキルを持つレッドチームによって定期的にテストする必要があります。現代において、セキュリティを無視することは自らの危険を招く行為です。過度に用心深い者だけが生き残るのです。

WSC が社会インフラにますます深く組み込まれるにつれて、オープンソースのハードウェアとソフトウェアの透明性は、セキュリティにとって不可欠な要素となるでしょう。コミュニティによる広範な検査とコラボレーションを可能にすることで、オープンソース アーキテクチャは脆弱性を明らかにし、ベストプラクティスを普及させるのに役立ちます。これが、Google が Titan のようなオープンソースのシリコン ルート オブ トラスト設計や、Open Compute Project のような組織をサポートしている大きな理由です。

今後、セキュリティの重要性は増すばかりです。地政学的な摩擦により、データ主権とデータ所在地に関する新たな要件が生まれています。基盤システムの完全性に対する信頼が極めて重要になり、物理世界とデジタル世界が絡み合うにつれ、工場ロボットから自動運転車まで、あらゆるものを保護することが重要になります。

今後の展望

AI / ML が人々の生活の一部としてますます重要性を増す今、必要となるコンピューティングの規模は今後も拡大していくでしょう。WSC におけるイノベーションの課題と可能性も同様に計り知れません。進化する AI は、遠からず WSC の設計自体を支援できるようになり、まったく新しい技術のフロンティアが開かれるかもしれません。

しかし、こうして技術が進歩するなかでも、Google が WSC における 25 年の経験から得た次の 3 つの教訓は、時代を超えて当てはまります。それは、(1)成功のためには、明確な目標を最後まで追求すること(ローンチよりもランディング)、(2)効果的な運用と段階的な改善のたゆまぬ追求によって大きな成果が得られること、(3)セキュリティに深く取り組まなければその他の部分は機能しないということです。

25 年を経て、ウェアハウス スケール コンピューティングはコンセプトから社会基盤へと驚くべき道のりを歩んできました。WSC にとって最高の瞬間が訪れるのは、まだこれからです。次の 25 年が過去 25 年と同じように進歩すれば、私たちは目覚ましい未来を迎えることになるでしょう。

-バイス プレジデント / エンジニアリング フェロー、Parthasarathy Ranganathan

-クラウド インフラストラクチャ部門シニア バイス プレジデント、Urs Hölzle

投稿先