Google Cloud アーキテクチャ フレームワークの信頼性に関する原則は、 Google Cloudのワークロードに対して技術的に実現可能な信頼性目標を定義するのに役立ちます。
この原則は、信頼性のスコープ設定の重点領域に関連しています。
原則の概要
ユーザーが満足できるほど十分に信頼できるシステムを設計します。直感に反するように思えますが、信頼性を 100% にするという目標は、多くの場合、最も効果的な戦略ではありません。信頼性を高めると、金銭的投資とイノベーションの制限の両面で、大幅な費用増加につながる可能性があります。ユーザーが現在のサービスレベルにすでに満足している場合、満足度をさらに高めるための取り組みは費用対効果が低くなる可能性があります。代わりに、リソースを他の場所に費やした方がよいでしょう。
ユーザーが満足できる信頼性のレベルを決定し、改善の費用がメリットを上回り始めるポイントを決定する必要があります。このレベルの十分な信頼性が確保されたら、リソースを戦略的に割り当て、ユーザーにより大きな価値をもたらす機能や改善に集中できます。
推奨事項
現実的な信頼性の目標を設定するには、次のサブセクションの推奨事項を検討してください。
一部の障害を許容し、コンポーネントに優先順位を付ける
稼働率 99.99% などの高可用性を目標としますが、稼働率 100% を目標に設定しないでください。失敗は避けられないことを認識する。
100% の稼働時間と 99.99% の目標値の差は、障害の許容範囲です。この差は、エラー バジェットと呼ばれます。エラー バジェットは、リスクを負ってイノベーションを起こすのに役立ちます。これは、競争力を維持するうえでどのビジネスにとっても基本的なことです。
システムで最も重要なコンポーネントの信頼性を優先します。重要度の低いコンポーネントには、障害に対する許容度を高く設定できます。
信頼性と費用のバランスを取る
システムの最適な信頼性レベルを決定するには、費用対効果を徹底的に分析します。
システム要件、障害の結果、特定のアプリケーションに対する組織のリスク許容度などの要素を考慮してください。目標復旧時間(RTO)や目標復旧時点(RPO)などの障害復旧指標を考慮してください。予算やその他の制約内で許容できる信頼性のレベルを決定します。
重要な信頼性機能に妥協することなく、効率を改善して費用を削減する方法を探します。