Stackdriver の透過的サービスレベル指標(SLI)

Google Cloud サービス自体、およびワークロードに対するその影響をモニタリングします。

stackdriver-sre-hero-banner

数値に基づいた IT 運用を可能に

現在、ほとんどの IT 運用チームでは、指標主導型の包括的なアプローチを基本方針としています。企業の多くは、サービスの可用性やパフォーマンスで IT を評価しています。しかしクラウド サービスを利用している IT チームでは、サービス関連の確実なデータを外部のクラウド プロバイダから入手することが困難な状況もあります。問題が発生したときにその場所を特定するにはどのようにしたらいいでしょうか。社内スタックとサービス プロバイダのどちらに問題があるのかを確認するにはどのようにしたらいいのでしょうか。透過的 SLI は、Google Cloud サービス自体とお客様のワークロードに対するその影響がモニタリングされるため、全体的な状況を把握できます。

measure-all-the-things

あらゆるものを測定

IT 担当者があらゆるサービス コンポーネントのパフォーマンスを把握できるよう、Google では 130 を超える Google Cloud サービスで、詳細な API レベルの指標を提供しています。こうした指標から、各 Google サービスに対するお客様のアプリケーションのリクエストのエラー数やレイテンシが示されます。このため、お客様のアプリケーションと、それが依存するサービスとの間の相関関係と副作用を把握できます。

real-transparency

高い透明性

SLI は、従来の「サービスの正常性」の概念に収まるものではありません。サービス間の特定のやり取りを確認して、環境的なデータと関連付けることができます。これにより、サービスの場所、サービスを呼び出すアプリケーションの認証情報、バージョンやレスポンス コードなどのさまざまな属性ごとにサービス指標をクロス集計して、関連性の調査および原因と効果の判定を可能にします。

透過的 SLI の実践的な使用

  • 特定のサービスに対する呼び出しの失敗が 1 人のユーザーのみで発生し、他のユーザーでは発生しない場合は、アカウント関連の問題が存在すると推定され、ユーザーが自力で容易に修正できます。
  • アプリのトラブルシューティングをしている際に、アプリのパフォーマンス低下が重要な GCP サービスのレイテンシの継続的な増大と相関していると判明した場合は、Google へサポートをご依頼ください。
  • ある GCP サービスのレポートで、以前と変わらずレイテンシに特に問題がないとされているにもかかわらず、アプリケーション内の指標のレポートでそのサービスの呼び出しのレイテンシが異常に長い場合、ネットワークに問題が発生している可能性があります。ネットワーク プロバイダ(場合によっては Google)に連絡して、デバッグ プロセスの開始をご依頼ください。

透明性に対する Google の取り組み

Google Cloud チームでは、サービスの詳細なパフォーマンス情報の共有に取り組んでいます。これは、Google SRE がサービスの稼働の保守に使用しているデータと同様のものです。この共有データ使用することで Google の状況は容易にモニタリングできるため、サービス チケットに関して共同作業を行う際は、関係者全員が同じ見解を共有しています。Google では、透過的 SLI が技術サポートに関するお客様のエクスペリエンスの改善とクラウド コンピューティングの信頼性向上に役立つと考えています。

Google Cloud

使ってみる

透過的なサービス指標の収集と調査を開始するには、[Stackdriver Metrics Explorer] に移動してリソースの種類に [Consumed API] を選択します。アプリケーションで使用しているプロダクトとサービスに応じて、グラフ化が可能な指標のリストが表示されます。次に、環境にとって最も重要な指標を選択します。モニタリングするサービス、メソッド、場所、認証情報、エラーコードを指定して表示するデータを絞り込みます。

アプリケーションに対してどの指標が最も重要であるかを判別した後、お客様と Google の主要な指標をグラフ化したカスタム ダッシュボードを作成することで、一般的な原因の把握に必要な統合ビューを獲得できます。最後に、お客様のトラフィックで Google サービスの動作とお客様のアプリケーションの許容範囲に関する長期的な基準が確立したら、その長期動作の基準から逸脱した場合にアラートが発生する設定などを検討できます。

使ってみる