Google Cloud Platform

Cloud OnAir 番組レポート : 一歩進んだ Monitoring でアプリケーションを改善しよう

Cloud OnAir は、Google Cloud の製品をわかりやすく解説し、最新の情報などをいち早く皆様にお伝えする Online 番組です。

2 月 28 日の放送は、「一歩進んだ Monitoring でアプリケーションを改善しよう」がテーマです。分散コンピューティングやマイクロサービスアーキテクチャの普及によりアプリケーションの複雑度も上がっています。これに合わせて、モニタリング(監視)に求められる要件も複雑化しています。一方、モニタリングを活用することによってユーザー体験を大きく改善することができます。本放送ではモニタリングを取り巻く状況と GCP を活用した実装方法をご紹介します。

現在、システム運用の業務に関わっており、コスト削減、運用業務の負荷軽減といった課題に悩まれている方を対象とした内容です。番組をご覧いただくことで、Google Cloud Platform(GCP)を利用したシステム運用(モニタリング、予防、問題対応) の概要を理解し、実際にどのように導入できるかのイメージを掴んでいただけます。

SLOを決める

システム運用とは、ある決まったサービスレベルでシステムを稼働させることです。このサービスレベルの目標(Service Level Objective)は、サービスの利用者の観点から定めることが求められます。利用者視点で SLO を再定義し、システムの稼働状況をモニタリングすることで、それまで見落としていたことを発見できる可能性もあります。番組では、稼働率を例に、運用者側と利用者側でその捉え方が異なるというケースを紹介します。

GCP を使った運用改善

次に、システム運用に関係する GCP のサービスとして、Stackdriver を詳しく解説します。
Stackdriver とは、高度な故障分析機能を有しており、アプリケーションの動作環境にまで踏み込んだデバッグやサービス間のトレーシングを行うことができます。また、マルチクラウド、ハイブリッドクラウド、オンプレミスと複数環境を統合的に管理することが可能で、さらにはサーバーレスの統合監視プラットフォームとして豊富な機能を一元的に提供します。

番組では、特にモニタリングと問題対応の2つの運用業務に対して、Stackdriver がどのように働くかをリファレンスアーキテクチャやいくつかのサービス(ProfilerTraceDebugger)を通じて、その特徴を説明します。

さらに、Stackdriver を実際にどのように活用しているかをお客様事例(エウレカ株式会社:「株式会社エウレカの導入事例:Stackdriver Logging でのログ監視や、BigQuery を駆使した分析・活用などにより、SLO 99.95% を達成」)を通じて紹介します。

モニタリングを見直すことが、ユーザー体験の改善に向けた第一歩となります。システム運用の次の一手を検討されている方はぜひ番組をご覧ください。

image

番組で説明した資料はこちらで公開しています。

cloud-onair-monitoring-2019228-1-638.jpg

Cloud OnAir では、各回 Google Cloud のエンジニアがトピックを設け、Google Cloud の最新情報を解説しています。過去の番組、説明資料、さらには視聴者からの質問と回答はこちらよりご覧いただけます。 最新の情報を得るためにもまずはご登録をお願いします。