Google Cloud アーキテクチャ フレームワークの信頼性の柱にあるこの原則は、ユーザー エクスペリエンスを評価し、検出結果を信頼性の目標と指標にマッピングするのに役立ちます。
この原則は、信頼性のスコープ設定の重点領域に関連しています。
原則の概要
オブザーバビリティ ツールは大量のデータを提供するが、そのデータのすべてがユーザーへの影響に直接関連しているわけではない。たとえば、CPU 使用率が高い、サーバー処理が遅い、タスクがクラッシュするなどの問題が発生する可能性があります。ただし、これらの問題がユーザー エクスペリエンスに影響しない場合は、サービス停止とは見なされません。
ユーザー エクスペリエンスを測定するには、内部システムの動作とユーザー向けの問題を区別する必要があります。ユーザー リクエストの成功率などの指標に重点を置きます。CPU 使用率などのサーバー中心の指標にのみ依存しないでください。サービス信頼性に関する誤った結論につながる可能性があります。真の信頼性とは、ユーザーがアプリケーションやサービスを一貫して効果的に使用できることを意味します。
推奨事項
ユーザー エクスペリエンスを効果的に測定するには、次のセクションの推奨事項を検討してください。
ユーザー エクスペリエンスを測定する
サービスの信頼性を正確に把握するには、ユーザーの実際の使用状況を反映する指標を優先します。たとえば、ユーザーのクエリ成功率、アプリケーションのレイテンシ、エラー率を測定します。
理想的には、このデータをユーザーのデバイスまたはブラウザから直接収集します。直接データ収集が不可能な場合は、システム内で測定ポイントをユーザーから徐々に遠ざけます。たとえば、ロードバランサまたはフロントエンド サービスを測定ポイントとして使用できます。このアプローチでは、問題がユーザーに大きな影響を与える前に問題を特定して対処できます。
ユーザー ジャーニーを分析する
ユーザーがシステムをどのように操作しているかを把握するには、Cloud Trace などのトレース ツールを使用します。アプリでのユーザーの操作をトレースすることで、ユーザー エクスペリエンスの低下につながるボトルネックやレイテンシの問題を見つけることができます。Cloud Trace は、サービス アーキテクチャの各ホップの詳細なパフォーマンス データをキャプチャします。このデータは、パフォーマンスの問題をより効率的に特定して対処するのに役立ち、信頼性が高く満足度の高いユーザー エクスペリエンスにつながります。