コンテンツに移動
システム

オープンソースの Google ワークロード トレースでシステム研究を前進させる

2022年5月19日
Google Cloud Japan Team

※この投稿は米国時間 2022 年 5 月 6 日に、Google Cloud blog に投稿されたものの抄訳です。

インターネットやクラウド コンピューティングの急速な拡大に伴い、ウェアハウス スケール コンピューティング(WSC)のワークロード(検索、メール、動画の共有、オンライン マップ、オンライン ショッピングなど)は地球規模に達し、増加するコンピューティング需要の大部分を占めるようになってきました。WSC のワークロードは、オンデマンドのスケーラビリティ、弾力性、可用性の要件においても他のワークロードとは異なります。

多くの研究(例:Profiling a warehouse-scale computer)や書籍(例: The Datacenter as a Computer: Designing Warehouse-Scale Machines)では、WSC のワークロードの特性は従来のベンチマークとは根本的に異なり、最適な効率を実現するには最新のコンピュータ アーキテクチャに変更する必要があることが指摘されています。Google のワークロードには、最新の CPU キャッシュの容量を超えるデータや命令のフットプリントがあるため、CPU はコードやデータの待機にかなりの時間を費やします。メモリ帯域幅を増やすだけでは問題は解決しません。アプリケーションのリクエストを処理するためのアクセスの多くがクリティカルパスにあるため、メモリ帯域幅を増やすだけでなく、メモリアクセスのレイテンシを短縮することも重要になります。

コンピュータ アーキテクチャ コミュニティでは長年にわたり、アーキテクチャ研究を行うには WSC のワークロード トレースが必要であると言われ続けてきました。このたび、Google は、厳選された Google ワークロード トレースを公開したことをお知らせいたします。これらのトレースを利用すると、システム設計者は WSC のワークロードが基盤となるコンポーネントとどのようにやりとりを行っているかを十分に把握したうえで、フロントエンドやデータアクセスのボトルネックに対応する新しいソリューションを開発できるようになります。

これらのワークロード トレースは、Google ワークロードを実行しているコンピュータ サーバーで DynamoRIO を使用してキャプチャされたものです。詳細は、https://dynamorio.org/google_workload_traces.html をご覧ください。ユーザーのプライバシーを保護するために、これらのトレースには命令アドレスとメモリアドレスのみが含まれています。

これらのトレースは、WSC のワークロードを把握し、プロセッサのフロントエンド、オンダイ相互接続、キャッシュ、メモリ サブシステムなど、WSC のワークロードに大きな影響を及ぼすあらゆる領域に関する社内研究で結果を出すために利用できることがわかっています。たとえば、Google はこれらのトレースを利用して AsmDB を開発しました。同様に、コンピュータ アーキテクチャ コミュニティが、これらのトレースを利用して他の WSC ワークロードのパフォーマンスや効率性を向上させる新しいアイデアを生み出すことができるよう願っています。


- バイス プレジデント(テクニカル フェロー)、Parthasarathy Ranganathan
- エンジニアリング マネージャー、Victor Lee
投稿先