コンテンツに移動
コンピューティング

Google Cloud のイノベーション優先のインフラストラクチャ

2022年7月21日
https://storage.googleapis.com/gweb-cloudblog-publish/images/GCP_Twitter_Card-20001000_jGrfo57.max-2000x2000.png
Google Cloud Japan Team

※この投稿は米国時間 2022 年 7 月 14 日に、Google Cloud blog に投稿されたものの抄訳です。

組織は、クラウドを使用して目的を達成する新たな方法を生み出すことで、ビジネスの完全なトランスフォーメーションを促進しています。それは、中核的なプロセスのさらなる効率化から、顧客リーチの改善やより良いサービスの提供、イノベーションを加速する分析情報の獲得まで多岐にわたります。

クラウド インフラストラクチャは、あらゆる組織のトランスフォーメーション戦略の中心にあります。そして Google Cloud の中核的な機能は、Google Cloud 上でソリューションを構築する際のスピードやシンプルさに長期的な違いを生み出す、幅広い革新の機会をもたらします。データ管理や機械学習から、セキュリティやサステナビリティまで、Google はこれからも、価値創出の基盤となるインフラストラクチャのイノベーションに徹底して投資していきます。まずは、お客様のイノベーションの促進を助けるインフラストラクチャの 3 つの特徴的な属性に焦点を当てていきます。

  • 最適化: お客様はそれぞれのニーズに合ったソリューションを求めています。お客様は、よく使われるワークロード、業種別ソリューションに加え、高パフォーマンス、コスト削減、もしくはその適切なバランスを取るといった特定の結果を出すようカスタマイズされたアプリを必要な場所で構築し、実行したいと考えています。また、ワークロードは Google Cloud 上でより快適に実行されるべきです。

  • 革新的: 革新とは、単にコスト削減や利便性のためにインフラストラクチャをクラウドに「リフト&シフト」することではありません。革新的なインフラストラクチャは、Google 最高峰の AI と ML の機能を統合し、極めて厳しいセキュリティ、主権、コンプライアンスのニーズを満たしつつ、イノベーションを加速します。

  • 簡単: クラウドのプラットフォームがますます多目的になったことで、その導入や運用は場合によって非常に複雑なものになってきています。ですが、簡単に使用できるクラウドのプラットフォームであれば、オペレーションの負担を軽減することが可能です。Google Cloud は、複雑なタスクをシンプルに見せてくれるというお客様からの声をよくいただきますが、これは意図的にそのように設計されているためです。

Google は、お客様を中心に据えるイノベーション文化を基盤に、20 年以上にわたりテクノロジーのリーダーとしての立場を維持してきました。ここでは、そうした分野における Google の新たなイノベーションの例をいくつか紹介します。

お客様にとって最も重要な部分に合わせて最適化されたソリューション

まずは、コスト パフォーマンスの最適化から見ていきましょう。昨年、Google はスケールアウト型ワークロードのパフォーマンスをコスト効率的に最適化した Tau VM をリリースしました。Tau T2D は、パフォーマンスと総所有コストの両方ですべての主要なパブリック クラウド プロバイダを追い抜き、その他の主要なクラウドにおける同等の VM と比べ最大 42% 優れたコスト パフォーマンスを発揮します。

本日、Tau VM ファミリーに Arm ベースのマシーンを追加することを発表し、お客様にさらなる選択肢を提供いたします。Ampere® Altra® Arm ベースのプロセッサを搭載した T2A VM は、卓越したシングルスレッド パフォーマンスを魅力的な価格で提供しているため、クラウドネイティブなスケールアウト型ワークロードに最適です。これによりデベロッパーは、ワークロードのテスト、開発、実行に最適なアーキテクチャを選択できるようになりました。

費用の最適化は、多くのお客様にとって重要な目標です。Spot VM では、アイドル状態のマシンサイクルの大幅な割引を利用することで、オンデマンド料金に比べ、60% 以上の割引保証と最大 91% 割引という大幅な節約が可能となります。この VM は、ハイ パフォーマンス コンピューティング、ビッグデータ、分析におけるバッチジョブやフォールト トレラントなワークロード向けとしては最高の選択肢です。お客様からは、より変動性が低く予測しやすい Spot VM の料金体系を求める声が届いています。Google はそのご意見に応え、他の主要なクラウドに比べ変動性が低く(月 1 回の料金変更)、より予測可能な料金体系で Spot VM を提供します。

今日の消費者からの高い需要、特に動画ストリーミングに関する需要に応えるためには、グローバル スケールに向けた最適化が欠かせません。2022 年 5 月にリリースした Media CDN は、臨場感あふれる動画ストリーム体験をグローバル スケールで届けることを目的に最適化されています。1,300 以上の都市で利用可能な Media CDN は、世界中の 20 億人のユーザーにコンテンツを届ける YouTube が使用するインフラストラクチャと同じものを活用しています。U-NEXT や Stan といったお客様は、素早く Media CDN を展開して、視聴者に最新かつ高画質なエクスペリエンスを提供しています。

さらに、新たに登場した機会としては、分散システムや分散された勤務者、そして必要な場所でどこでもアプリを構築、実行できる機能があります。Google Distributed Cloud であれば、Google Cloud のインフラストラクチャやサービスを、オンプレミスまたはコロケーション データセンターや、さまざまなエッジ環境といった、別の物理的な場所(または分散型環境)に展開することができます。すべての Google Distributed Cloud サービスを動かす Anthos は、任意の場所で最新のコンテナ化されたアプリケーションを大規模に構築、デプロイ、実行するための共通のコントロール プレーンを提供しています。

選択肢を広げるため、Google は複数の機能を持つハードウェア、ソフトウェア、サービスのポートフォリオとして Google Distributed Cloud を設計し、お客様のワークロードやユースケースの固有要件に対応しています。お客様はビジネスのニーズに合うサービスを Edge、Virtual、Hosted からお選びいただけます。

AI / ML とセキュリティを通じた革新の加速

機械学習分野におけるイノベーションのペースは加速し続けており、Google は長期にわたってこの分野のパイオニアであり続けています。検索や YouTube から Play やマップまで、ML は Google のプロダクトの機能を最大限引き出します。お客様に最高水準のサービスを提供できるところまで到達したことを示す好例として、JAX と Cloud TPU v4 の 2 つを紹介します。

JAX は、Google の研究者が開発した最先端のオープンソースの ML フレームワークです。JAX は、ML の実務担当者にさらなる柔軟性を与え、最大限の規模にまでモデルを簡単にスケーリングできるように設計されています。

Google は最近、新しい ML ハブを通してすべてのお客様が Cloud TPU v4 Pod を利用できるようにしました。この Cloud TPU v4 Pod のクラスタは、ピーク時の集計パフォーマンスが 9 エクサフロップスにもなり、消費電力の 90% をカーボンフリー エネルギーで賄っている、世界で最も速く、効率的で、サステナブルな ML インフラストラクチャ ハブです。Cloud TPU v4 では、自然言語処理モデルやレコメンダー モデルなど、さまざまな高度なモデルのトレーニングが可能となります。お客様はすでにそのメリットを実感しており、Cohere はトレーニング時間の 70% 改善を達成し、LG Research は大規模なマルチモーダルの 3,000 億パラメータ モデルのトレーニングに Cloud TPU v4 を活用しています。

セキュリティの分野では、サイバーセキュリティの脅威によるリスクが高まっていることで、あらゆる企業がセキュリティ体制の見直しを迫られています。安全性、性能、信頼性に優れた Google の世界規模のネットワークに投資するだけでなく、Google は業界規模のフレームワークや基準を率先して定義することでも、お客様のソフトウェアのサプライ チェーンのさらなる強化を支えています。Google は昨年、ソフトウェアのサプライ チェーン全体でアーティファクトの整合性を確保するための、エンドツーエンドのフレームワークである SLSA(ソフトウェア アーティファクトのためのサプライチェーン レベル)を発表しました。これは、Google 社内で実施している多くのプロセスをオープンソース化したものです。

Google は、複雑な構成やパフォーマンスの低下なしにセキュリティを確保することを課題としています。Confidential VMs がその一例です。データは高信頼実行環境に保存され、それ以外の場所ではデバッガを使用したとしても、データや実行された操作を閲覧することはできません。もう 1 つは Cloud Intrusion Detection System(Cloud IDS)です。これは、ML を活用した脅威分析を基盤に構築されたネットワークの脅威検出システムで、1 日 に 15 兆のトランザクションを処理して新たな脅威を特定し、毎日 430 万の独自のセキュリティ アップデートを作成しています。CyberRatings.org で最高評価の AAA を獲得する Cloud IDS は、実質、すべての攻撃をブロックできるだけの効果が実証されています。

デベロッパー重視の使いやすさ

Google が重視するのは、使いやすいツールでイノベーションを加速し、変革プロセスをシンプルなものにすることです。本日、数千のバッチジョブを 1 つのコマンドで実行できるフルマネージドのジョブ スケジューラである Batch のプレビュー版を紹介いたします。設定は簡単で、MPI ライブラリが必要なワークロードを含めたスループット指向のワークロードもサポートしています。自動的にスケーリングされるリソースでジョブが実行されるため、より価値のある作業に時間を費やすことが可能です。これにより、ゲノミクス シーケンシング、メディアのレンダリング、金融リスク モデリング、電子設計自動化といった、HPC、AI / ML、データ処理のワークロードの実行におけるデベロッパーのエクスペリエンスが向上されます。

さらなる使いやすさの実現に向けたイノベーションを続けていくために、Google は最近、新しい HPC toolkit の提供を発表しました。これは Google Cloud のオープンソース ツールで、ユーザーは実績のあるベスト プラクティスに基づいて、再現可能ですぐに使用できる HPC クラスタを数分で作成できます。いくつかのブループリントとともに提供されており、さらに、Slurm スケジューラや、Intel の DAOS、DDN の Lustre といったストレージなど、サードパーティ コンポーネントに対する幅広いサポートも備えています。

システムのパフォーマンスと、インフラストラクチャが何をしているかを把握することが、セキュリティと密接につながっていますが、その効果的な実現には操作が簡単である必要があります。Google は最近、自動的に VPC ネットワークの構成をモニタリングすることで、リアクティブなワークフローをプロアクティブなプロセスに変身させて、ネットワークとサービスのダウンタイムを減らすことができるように、ネットワーク アナライザを導入しました。ネットワーク アナライザを含む Network Intelligence Center では、Google Cloud ネットワークのオブザーバビリティ、モニタリング、トラブルシューティングのための単一コンソールを提供しています。

これは、使いやすく革新的で、最適化されたプラットフォーム上で、オンプレミスからエッジやクラウドまで、イノベーションとスケーリングを自由かつ安全に行えるインフラストラクチャをお客様に提供するために、Google が Google Cloud 内で提供しているサービスのほんの一例です。Broadcom や Snap といったお客様が、最も大きな課題を解決するために Google Cloud の柔軟なインフラストラクチャをどのように活用しているかについての詳細は、本日公開の Infrastructure Spotlight イベントをご確認ください。

- インフラストラクチャ担当バイス プレジデント兼ゼネラル マネージャー Sachin Gupta

投稿先