GKE のトラブルシューティングの概要

Autopilot Standard

Google Kubernetes Engine（GKE）でサービスのスムーズな実行状態を維持できるよう、問題のトラブルシューティングを効果的に行う方法を学習します。Kubernetes の初心者でも経験豊富なユーザーでも、よくある問題をモニタリング、診断、解決するための体系的なアプローチを学ぶことができます。

次のツールと手法を使用して、GKE のトラブルシューティングスキルを高めます。

クラスタに影響を与える可能性のある、信頼性に関して進行中のインシデントについて、 Google Cloud サービスの健全性とインシデントを確認します。
潜在的な問題をすばやく特定するために、 Google Cloud コンソールでクラスタとワークロードの健全性を評価します。
ノードや Pod などのリソースのライブステータスを確認するために、kubectl コマンドラインツールを使用してクラスタの状態を調査します。
障害の根本原因を特定するために、Cloud Logging で履歴分析を実施します。
ユーザーに影響が及ぶ前に問題に対処するために、Cloud Monitoring で予防的モニタリングを行います。
Gemini Cloud Assist で診断を迅速化するために、ステップごとのガイダンスを受け取り、問題を自動的に調査します。
実際のアプリケーションの障害を診断して解決するために、トラブルシューティングのシナリオ例に沿って、これらのツールが連動する仕組みを学習します。

基本的な概念を理解する

Kubernetes と GKE を初めて使用する場合は、トラブルシューティングを開始する前に、クラスタアーキテクチャや Pod とノードの関係などのコアコンセプトを理解することが不可欠です。詳細については、GKE の学習を開始するをご覧ください。

また、GKE のどの部分のメンテナンスをお客様が担当し、どの部分を Google Cloud が担当するのかを理解することも重要です。詳細については、GKE の共有責任をご覧ください。

次のステップ

Google Cloud サービスの健全性とインシデントを確認する（このシリーズの次のページ）を読む。
GKE のトラブルシューティングガイドで特定の問題の解決に関するヒントを確認する。
このドキュメントに問題のソリューションが見当たらない場合は、サポートを受けるで、次のトピックに関するアドバイスなど、詳細なヘルプをご覧ください。
- Cloud カスタマーケアに問い合わせて、サポートケースを登録する。
- StackOverflow で質問する、google-kubernetes-engine タグを使用して類似の問題を検索するなどして、コミュニティからサポートを受ける。#kubernetes-engine Slack チャネルに参加して、コミュニティサポートを利用することもできます。
- 公開バグトラッカーを使用して、バグの報告や機能リクエストの登録を行う。