クラウド内のワークロードにとって、信頼性の高いインフラストラクチャは重要な要件です。クラウド アーキテクトとして、ワークロードに適した信頼性の高いインフラストラクチャを設計するには、選択したクラウド プロバイダの信頼性の能力を十分に理解する必要があります。このドキュメントでは、Google Cloud における信頼性の構成要素(ゾーン、リージョン、ロケーションの範囲内のリソース)と、それらが提供する可用性レベルについて説明します。このドキュメントでは、ワークロードの信頼性要件を評価するためのガイドラインと、Google Cloud で信頼性の高いインフラストラクチャを構築および管理するためのアーキテクチャに関する推奨事項について説明します。
このドキュメントは、次の部分に分かれています。
- 信頼性の概要(本編)
- Google Cloud における信頼性の構成要素
- クラウド ワークロードの信頼性要件を評価する
- Google Cloud のワークロードに適した信頼性の高いインフラストラクチャを設計する
- Google Cloud でワークロードのトラフィックと負荷を管理する
- Google Cloud インフラストラクチャの管理とモニタリング
以前にこのガイドを読んだことがあり、変更点を確認したい場合は、リリースノートをご覧ください。
信頼性の概要
アプリケーションやワークロードは、可用性と障害に対する回復力に関する現在の目標を達成している場合に信頼性があるといえます。
可用性(または稼働時間)とは、アプリケーションが使用できる時間の割合のことです。たとえば、99.99% の可用性を目標とするアプリケーションの場合、24 時間中のダウンタイムの合計が 8.64 秒を超えてはいけません。可用性は、アプリケーションが所定の期間に正常に処理したリクエストの割合として測定されることもあります。たとえば、99.99% の可用性を目標とするアプリケーションの場合、100,000 件のリクエストの受信に対して、10 件を超えるリクエストが失敗してはいけません。可用性は、多くの場合、パーセンテージの 9 の数で表されます。たとえば、99.99% の可用性は「フォア(4)ナイン」と表現されます。
アプリケーションの目的に応じて、アプリケーションの信頼性を示す指標が異なる場合があります。そのような信頼性の指標の例を次に示します。
- コンテンツを提供するアプリケーションでは、可用性、レイテンシ、スループットが、信頼性の重要な指標となります。これは、アプリケーションがリクエストに応答できるかどうか、アプリケーションがリクエストに応答するのにかかる時間、アプリケーションが一定期間内に正常に処理できるリクエストの数を示しています。
- データベースやストレージ システムでは、レイテンシ、スループット、可用性、耐久性(データの損失や破損からどれだけ保護されているか)が信頼性の指標となります。これは、システムがデータの読み書きにかかる時間と、データにオンデマンドでアクセスできるかどうかを示しています。
- ビッグデータおよび分析ワークロード(データ処理パイプラインなど)では、一貫したパイプラインのパフォーマンス(スループットとレイテンシ)が、データ プロダクトの鮮度を確保するために必要であり、重要な信頼性の指標となります。これは、処理可能なデータ量と、パイプラインがデータの取り込みからデータ処理までにかかる時間を示しています。
- ほとんどのアプリケーションでは、データの精度が最も重要な信頼性の指標となります。
アプリケーションの信頼性目標を定義するための詳細なガイドラインについては、クラウド ワークロードの信頼性要件を評価するをご覧ください。
アプリケーションの信頼性に影響する要素
Google Cloud にデプロイされるアプリケーションの信頼性は、次の要素に左右されます。
- アプリケーションの内部設計。
- アプリが依存するセカンダリ アプリケーションまたはコンポーネント。
- Google Cloud インフラストラクチャ リソース(アプリケーションが実行されるコンピューティング、ネットワーキング、ストレージ、データベース、セキュリティなど)と、アプリケーションでインフラストラクチャを使用する方法。
- プロビジョニングするインフラストラクチャの容量と、容量のスケーリング方法。
- アプリケーション、その依存関係、Google Cloud インフラストラクチャの構築、デプロイ、メンテナンスに使用する DevOps プロセスとツール。
次の図に、これらの要因がまとめられています。
上の図に示すように、Google Cloud にデプロイされたアプリケーションの信頼性は、複数の要因によって左右されます。このガイドでは、Google Cloud インフラストラクチャの信頼性に焦点を当てます。
次のステップ
- Google Cloud における信頼性の構成要素
- クラウド ワークロードの信頼性要件を評価する
- Google Cloud のワークロードに適した信頼性の高いインフラストラクチャを設計する
- Google Cloud でワークロードのトラフィックと負荷を管理する
- Google Cloud インフラストラクチャの管理とモニタリング
協力者
作成者:
- クラウド ライフサイクル SRE UTL Nir Tarcic
- クロス プロダクト ソリューション デベロッパー Kumar Dhanagopal
その他の関係者:
- 上級エンジニア Alok Kumar
- 信頼性、エンジニアリング フェロー Andrew Fikes
- SRE TL Chris Heiser
- サイト信頼性エンジニアリング担当ディレクター David Ferguson
- シニア プロダクト カウンセル Joe Tan
- プリンシパル エンジニア Krzysztof Duleba
- プリンシパル SRE Narayan Desai
- エンジニアリング担当バイス プレジデント Sailesh Krishnamurthy
- 信頼性アドボケイト Steve McGhee
- プロダクト マネージャー Sudhanshu Jain
- ソフトウェア エンジニア Yaniv Aknin