Google Cloud ワークロード向けの信頼性の高いインフラストラクチャ構築について知っておくべきこと
Google Cloud Japan Team
※この投稿は米国時間 2023 年 1 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
クラウド内のワークロードの信頼性が気になりますか?アプリケーションにダウンタイムが発生することが不安で、夜も眠れないことはありませんか?Google も信頼性について常に考えており、お客様のワークロードが信頼性の高い基盤で実行されるように対策を講じています。Google Cloud はインフラストラクチャ障害に対処して迅速に復旧するよう設計されています。さらに、サービス停止を回避し、Google Cloud インフラストラクチャの耐障害性を改善するための投資とイノベーションを絶えず行っています。
クラウド ワークロード用に信頼性の高いインフラストラクチャを構築して管理するお客様を支援するため、Google は包括的な Google Cloud インフラストラクチャ信頼性ガイドを用意しました。業界をリードする信頼性のベスト プラクティスと、Google の信頼性エンジニアの深い専門知識を組み合わせたガイドです。
本当の意味での信頼性とは
Google Cloud インフラストラクチャ信頼性ガイドの導入部分は、信頼性によってワークロードごとに異なる結果が生じることに関する理解を促します。たとえば、コンテンツ提供アプリケーションに使われる信頼性の指標は、データベースや分析ワークロード用の信頼性の指標とは異なる場合があります。
信頼性に関する不安を払拭すべく、ユーザーに代わって Google Cloud が管理することは可能か
答えはイエスです。Google Cloud サービスは SLA を提供しています。ただし、クラウド内のワークロード向けに信頼性の高いインフラストラクチャを構築するための適切な設計を選ぶためには、ユーザーが Google Cloud のプラットフォームレベルでの信頼性について理解する必要があります。Google Cloud インフラストラクチャ信頼性ガイドは、Google Cloud における信頼性の構成要素を紹介し、こうした構成要素がクラウド リソースの可用性にどのように影響するかについて詳しく説明しています。リージョンとゾーンについて、および単一ゾーン、複数のゾーン、またはリージョン間でデプロイされたアプリケーションのプラットフォーム レベルでの可用性目標についての理解を深めることができます。また、ゾーン、リージョン、グローバル リソースの信頼性の違いについても知ることができます。
Google Cloud 内のワークロード向けに信頼性の高いインフラストラクチャを構築する方法
Google Cloud の構成要素を利用して信頼性の高いインフラストラクチャを構築するためには、まずワークロードの信頼性の要件を評価する必要があります。信頼性の要件をできる限りきめ細かく特定して、最も重要な要件に IT 関連の支出を集中させます。ビジネスにおいて可用性が比較的重要であると思われる期間を特定し、信頼性とその他の要件のトレードオフを検討します。
ワークロードの信頼性要件を評価したら、Google Cloud 内で信頼性の高いインフラストラクチャを設計して、リソース、ゾーン、リージョン レベルで障害からワークロードを保護する必要があります。Google Cloud インフラストラクチャ信頼性ガイドでは、アプリケーション スタックにおける単一障害点(SPOF)を回避する重要性を強調しています。ガイドでは、複数の場所にリソースを分散させて冗長リソースをデプロイする際に選択できる、デプロイ アーキテクチャについて説明しています。
シングルゾーン アーキテクチャは、ダウンタイムを許容できるワークロードや、必要に応じて別の場所にすばやくデプロイできるアプリケーションには十分かもしれません。
マルチゾーン アーキテクチャは、ゾーンの停止に対する耐障害性が求められるワークロードに適していますが、リージョンの停止に起因するダウンタイムも許容できます。
マルチリージョン デプロイ アーキテクチャは、ビジネスクリティカルで、高可用性が求められるワークロードに最適です(小売アプリケーションやソーシャル メディア アプリケーションなど)。
クラウド内で分散ワークロードを実行するとき、さまざまな場所にある利用可能なリソースにトラフィックが効率的にルーティングされるようにすることが重要です。Google Cloud インフラストラクチャ信頼性ガイドでは、キャパシティ プランニング、自動スケーリング、ロード バランシングなどのトラフィックと負荷の管理手法について解説しており、クラウド ワークロードの信頼性の改善につなげることができます。ガイドの最後の部分では、インフラストラクチャの変更を段階的にデプロイする、グローバル リソースへの変更を管理するといった、インフラストラクチャ リソースの信頼性リスクを低減するためのチェンジ マネジメント ガイドラインの概要を説明しています。
分散デプロイは、重要なビジネス アプリケーションの高信頼性を確保するのに役立ちますが、それだけではありません。大規模な障害イベントの発生時にビジネスを継続させるために、クラウド リソースを複数の場所に分散させるだけではない、さらなる手段を講じることができます。たとえば、DR テスト、インシデント管理、インシデント発生後のアプリケーション機能の検証、事後検証の実施のための運用プラクティスを導入することが可能です。
さらにサポートが必要な場合
Google Cloud インフラストラクチャ信頼性ガイドを読んだ後に、クラウド ワークロード向けに信頼性の高いインフラストラクチャを構築するためのさらなるサポートが必要であれば、Google Cloud スペシャリストまでお問い合わせください。ワークロードと信頼性の目標についてお知らせいただければ、信頼性の高いインフラストラクチャを設計するためのアーキテクチャの選択肢を理解し、評価するお手伝いをさせていただきます。
Google Cloud 内で信頼性の高いワークロードを実行する方法を学ぶ
レート制限戦略と手法を学ぶ。
ランサムウェア攻撃を軽減するためのベスト プラクティスを実施する。
クラウドの障害復旧(DR)に対応するワークロードを設計する。
- Google、シニア スタッフ エンジニア Nir Tarcic
- Google、クロス プロダクト ソリューション デベロッパー Kumar Dhanagopal