インフラモダナイゼーション

Google Cloud ワークロード向けの信頼性の高いインフラストラクチャ構築について知っておくべきこと

2023年1月26日

Google Cloud Japan Team

※この投稿は米国時間 2023 年 1 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。

クラウド内のワークロードの信頼性が気になりますか？アプリケーションにダウンタイムが発生することが不安で、夜も眠れないことはありませんか？Google も信頼性について常に考えており、お客様のワークロードが信頼性の高い基盤で実行されるように対策を講じています。Google Cloud はインフラストラクチャ障害に対処して迅速に復旧するよう設計されています。さらに、サービス停止を回避し、Google Cloud インフラストラクチャの耐障害性を改善するための投資とイノベーションを絶えず行っています。

クラウドワークロード用に信頼性の高いインフラストラクチャを構築して管理するお客様を支援するため、Google は包括的な Google Cloud インフラストラクチャ信頼性ガイドを用意しました。業界をリードする信頼性のベストプラクティスと、Google の信頼性エンジニアの深い専門知識を組み合わせたガイドです。

本当の意味での信頼性とは

Google Cloud インフラストラクチャ信頼性ガイドの導入部分は、信頼性によってワークロードごとに異なる結果が生じることに関する理解を促します。たとえば、コンテンツ提供アプリケーションに使われる信頼性の指標は、データベースや分析ワークロード用の信頼性の指標とは異なる場合があります。

信頼性に関する不安を払拭すべく、ユーザーに代わって Google Cloud が管理することは可能か

答えはイエスです。Google Cloud サービスは SLA を提供しています。ただし、クラウド内のワークロード向けに信頼性の高いインフラストラクチャを構築するための適切な設計を選ぶためには、ユーザーが Google Cloud のプラットフォームレベルでの信頼性について理解する必要があります。Google Cloud インフラストラクチャ信頼性ガイドは、Google Cloud における信頼性の構成要素を紹介し、こうした構成要素がクラウドリソースの可用性にどのように影響するかについて詳しく説明しています。リージョンとゾーンについて、および単一ゾーン、複数のゾーン、またはリージョン間でデプロイされたアプリケーションのプラットフォームレベルでの可用性目標についての理解を深めることができます。また、ゾーン、リージョン、グローバルリソースの信頼性の違いについても知ることができます。

Google Cloud 内のワークロード向けに信頼性の高いインフラストラクチャを構築する方法

Google Cloud の構成要素を利用して信頼性の高いインフラストラクチャを構築するためには、まずワークロードの信頼性の要件を評価する必要があります。信頼性の要件をできる限りきめ細かく特定して、最も重要な要件に IT 関連の支出を集中させます。ビジネスにおいて可用性が比較的重要であると思われる期間を特定し、信頼性とその他の要件のトレードオフを検討します。

ワークロードの信頼性要件を評価したら、Google Cloud 内で信頼性の高いインフラストラクチャを設計して、リソース、ゾーン、リージョンレベルで障害からワークロードを保護する必要があります。Google Cloud インフラストラクチャ信頼性ガイドでは、アプリケーションスタックにおける単一障害点（SPOF）を回避する重要性を強調しています。ガイドでは、複数の場所にリソースを分散させて冗長リソースをデプロイする際に選択できる、デプロイアーキテクチャについて説明しています。

シングルゾーンアーキテクチャは、ダウンタイムを許容できるワークロードや、必要に応じて別の場所にすばやくデプロイできるアプリケーションには十分かもしれません。
マルチゾーンアーキテクチャは、ゾーンの停止に対する耐障害性が求められるワークロードに適していますが、リージョンの停止に起因するダウンタイムも許容できます。
マルチリージョンデプロイアーキテクチャは、ビジネスクリティカルで、高可用性が求められるワークロードに最適です（小売アプリケーションやソーシャルメディアアプリケーションなど）。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1-multi-region-global-lb-01_XAHobCj.max-2200x2200.jpg

グローバルロードバランシングによるマルチリージョンデプロイ

https://storage.googleapis.com/gweb-cloudblog-publish/images/2-multi-region-regional-lb.max-2200x2200.jpg

リージョンロードバランシングによるマルチリージョンデプロイ

https://storage.googleapis.com/gweb-cloudblog-publish/images/3-dual-region.max-1500x1500.jpg

マルチゾーンデプロイ

https://storage.googleapis.com/gweb-cloudblog-publish/images/4-single-region.max-1500x1500.jpg

シングルゾーンデプロイ

クラウド内で分散ワークロードを実行するとき、さまざまな場所にある利用可能なリソースにトラフィックが効率的にルーティングされるようにすることが重要です。Google Cloud インフラストラクチャ信頼性ガイドでは、キャパシティプランニング、自動スケーリング、ロードバランシングなどのトラフィックと負荷の管理手法について解説しており、クラウドワークロードの信頼性の改善につなげることができます。ガイドの最後の部分では、インフラストラクチャの変更を段階的にデプロイする、グローバルリソースへの変更を管理するといった、インフラストラクチャリソースの信頼性リスクを低減するためのチェンジマネジメントガイドラインの概要を説明しています。

分散デプロイは、重要なビジネスアプリケーションの高信頼性を確保するのに役立ちますが、それだけではありません。大規模な障害イベントの発生時にビジネスを継続させるために、クラウドリソースを複数の場所に分散させるだけではない、さらなる手段を講じることができます。たとえば、DR テスト、インシデント管理、インシデント発生後のアプリケーション機能の検証、事後検証の実施のための運用プラクティスを導入することが可能です。

さらにサポートが必要な場合

Google Cloud インフラストラクチャ信頼性ガイドを読んだ後に、クラウドワークロード向けに信頼性の高いインフラストラクチャを構築するためのさらなるサポートが必要であれば、Google Cloud スペシャリストまでお問い合わせください。ワークロードと信頼性の目標についてお知らせいただければ、信頼性の高いインフラストラクチャを設計するためのアーキテクチャの選択肢を理解し、評価するお手伝いをさせていただきます。