Stackdriver Service Monitoring早期アクセス

Istio サービスと Google App Engine サービス用の Stackdriver Service Monitoring。

Stackdriver と Istio の導入イメージ

Stackdriver Service Monitoring

最新のアプリケーションは複数のサービスで構成されており、特定の用途をサポートする数十、場合によっては数百にも及ぶ依存関係が存在します。そのどこかで障害が発生すると、多数の障害が同時に発生しているように見えることも珍しくありません。このような複雑さを管理できるように、Stackdriver ではモニタリング サービスを追加しており、Cloud Services Platform や Istio サービスのメッシュ技術を通じて提供されています。Stackdriver Service Monitoring は、Google App Engine サービスもモニタリングできます。

サービスの可観測性

サービスの可観測性

サービス内部の依存関係を理解するのは困難ですが、同様にサービス間の関係性と接続性のパターンも複雑かつ変化に富んでいる場合があります。Stackdriver Service Monitoring が提供するサービスグラフでは、アプリケーション内のすべてのサービスとその関係性が示されるため、依存関係を一目で確認できます。サービスグラフにはサービス間のトラフィック、エラー、レイテンシも表示されるため、どのサービスが他のサービスのパフォーマンスや可用性に影響を与えているのかがわかります。サービスグラフでは時間の経過に伴って何が変化したのかも確認できるため、問題を容易に特定できます。Stackdriver Service Monitoring のサービスグラフには、サービスとその依存関係に関するリアルタイム情報と履歴情報が表示されるため、アプリケーションを可視化して、根本原因分析と復旧にかかる時間を短縮できます。

サービスレベル目標の設定

サービスレベル目標の設定

Google のサービス モニタリング機能をご利用いただくことで、サービスレベル目標を設定およびモニタリングし、これに基づいてチームにアラートを送れるため、ビジネスにとって重要な事項に注力できます。Istio(および App Engine)独断的な方法でインストゥルメント化されているため、サービス間のトランザクション数、エラー数、レイテンシの分布が正確にわかります。可用性とパフォーマンスの目標を設定するだけで、サービスレベル指標(SLI)、目標への準拠状況の推移、残りの「エラー バジェット」に対応するグラフが自動的に生成されます。このような目標が満たされていない場合は、サービスを修正する対策を取るようにアラートが送られます。

可観測性を高めるエルゴノミクス

可観測性を高めるエルゴノミクス

Stackdriver Service Monitoring にはインタラクティブなダッシュボードが用意されているため、複数の指標やログ、トレースを行き来することなく、すべてのシグナルについてサービスの動作を深く掘り下げることができます。ダッシュボードごとに特定のサービスに的が絞られているため、特定の期間にさらに絞り込めます。可用性の問題を診断する場合は、指標のヒートマップとトレースにドリルダウンし、ログやエラーレポートを調べ、本番環境のデバッガ(インストゥルメント化している場合)を開くことができます。サービス ダッシュボードでは、範囲を絞り込む単一の一貫性のある方法が提供されます。サービスに対するアラートから特定の限られた期間やトラフィックの一部分に絞り込み、最終的には潜在的原因へとつなげることができます。サービスの問題を最短で見極められる方法です。

Istio サービスのモニタリングを実際に使用する

  • Stackdriver Service Monitoring の SLO を使用して、アプリの問題をモニタリングおよび検出します
  • Stackdriver のサービスグラフを使用して、サービスの依存関係と問題の原因となっている可能性が高いサービスを把握します
  • サービス ダッシュボードを使用して、対象となるサービスから発生する各種シグナルに対処し、根本原因を突き止めます

このプロダクトは早期アクセスです。プロダクトのリリース段階の詳細については、こちらをご覧ください。