コンテンツに移動
GKE

GKE ダッシュボードで GKE Autopilot のアプリケーションをモニタリング

2021年5月6日
Google Cloud Japan Team

※この投稿は米国時間 2021 年 4 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。 

Accelerate: State of DevOps のレポートによると、一流のソフトウェア開発チームは、パフォーマンスの低いチームに比べて、より頻繁にモニタリング オブザーバビリティ ツールの自動化や統合を行っているそうです。そして、アプリケーションに最高レベルの信頼性、セキュリティ、スケーラビリティを求めている組織に選ばれているのが、Google Kubernetes Engine(GKE)です。最近 Google は、GKE Autopilot をリリースし、クラスタ インフラストラクチャ、コントロール プレーン、ノードの管理を自動化することで Kubernetes の運用をさらに簡素化しました。とはいえ、インフラストラクチャ管理を自動化しても、Autopilot クラスタ上で実行しているアプリケーションのモニタリングやトラブルシューティングを行う必要があります。GKE Autopilot を使用してアプリケーションを開発、実行している場合、Cloud Monitoring の GKE ダッシュボードを使用すると、指標とログが自動的に取り込まれて表示されるため、モニタリングやトラブルシューティングが容易になります。高度なツールである GKE ダッシュボードでは、オブザーバビリティ データとそれに関連する豊富なコンテキストがわかりやすい形式で表示されます。

オブザーバビリティ データが自動的に利用可能に

GKE Autopilot のすべてのクラスタは、特別な操作を行わなくても、Google Cloud のオペレーション スイートに指標とログを送信するよう構成されています。そのため、GKE ダッシュボードに移動すると、Autopilot クラスタ、Namespace、ノード、ワークロード、サービス、Pod、コンテナが、他のすべての GKE デプロイメントと一緒に表示されます。指標、ログ、イベント、アラート、インシデント、SLO などの情報を総合的に確認できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GKE_Dashboard-AP.max-1600x1600.png
GKE ダッシュボード(Autopilot クラスタと標準の GKE クラスタの指標とログを表示)

コンテキスト内のオブザーバビリティ

Google Cloud のロギングツールとモニタリング ツールは GKE と緊密に統合されているため、モニタリング対象のすべてのリソースへの直接リンクをダッシュボードに組み込むことができます。また、コンテキスト ダッシュボードからログへの移動も簡単にできます。テーブルの中のグラフをクリックすると、選択したリソースのすべてのログを一覧表示するサイドパネルが表示されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Logs-GKEdash-AP.max-1600x1600.png
リソースをクリックするだけで GKE ダッシュボード内のログを表示

より詳細な分析を行うには、ログ エクスプローラMetrics Explorer に移動します。

GKE Autopilot を使用したモニタリングとロギングのための一般的なシナリオ

Autopilot では、Google SRE がクラスタ管理を処理するだけでなく、プロビジョニング、メンテナンス、ライフサイクル管理などの運用を含めたノードの管理も行います。Autopilot は、ホストとコントロール プレーンに対する SLA に加え、業界初となる Pod に対する SLA も提供します。インフラストラクチャと運用が自動化されているため、アプリケーションそのものの作業に専念できます。

アプリケーションの SLO を設定する

Cloud Monitoring を使用すると、サービスレベル指標(SLI)に対するサービスレベル目標(SLO)を作成して、目標に照らし合わせたパフォーマンス測定を行うことができます。SLI は、可用性、レイテンシ、その他のカスタムの定義指標に基づいて定められたパフォーマンス指標です。

https://storage.googleapis.com/gweb-cloudblog-publish/images/pasted_image_0_dOBhf6d.max-600x600.max-600x600.png
サービスにおける SLO ステータスの例

トラブルシューティング

最新のコンテナベースのアプリケーションでは、サービスの確実な運用に向けて、デベロッパーや DevOps、SRE のチームがさらに多くの責任を担うようになってきています。そのため、インシデントが発生した際には、インフラストラクチャに起因した問題ではないことを確認する必要があります。その際に役立つのが GKE ダッシュボードです。このダッシュボードでは、GKE Autopilot リソースと標準リソースを一目で確認できるため、アプリケーションそのものの調査を始める前に、サービス中断の考えられる原因を確認できます。

使ってみる

GKE Autopilot の指標とログは自動的に Cloud Logging と Cloud Monitoring にインポートされるため、インストールや構成を行わずに、すぐに使い始めることができます。Cloud Monitoring の GKE ダッシュボードに直接移動して Autopilot の指標とログを表示してみましょう。または、こちらのドキュメントのページでより詳しい情報を確認することもできます。

-プロダクト マーケティング マネージャー John Day

投稿先