問題のトラブルシューティングを効果的に行う方法を学習して、Google Kubernetes Engine(GKE)でサービスをスムーズに実行できるようにします。Kubernetes の初心者でも経験豊富なユーザーでも、一般的な問題のモニタリング、診断、解決のための体系的なアプローチを学ぶことができます。
次のツールと手法を使用して、GKE のトラブルシューティング スキルを構築します。
クラスタに影響を与える可能性のある信頼性に関する進行中のインシデントについては、サービスの状態とインシデントを確認 Google Cloud してください。
Google Cloud コンソールでクラスタとワークロードの健全性を評価することで、潜在的な問題をすばやく特定します。
kubectl
コマンドライン ツールを使用してクラスタの状態を調査することで、ノードや Pod などのリソースのライブ ステータスを表示します。Cloud Logging で履歴分析を行うことで、障害の根本原因を特定します。
Cloud Monitoring でプロアクティブなモニタリングを行うことで、ユーザーに影響が及ぶ前に問題に対処します。
Gemini Cloud Assist で診断を迅速化: エラーを分析し、段階的なガイダンスを受け取り、問題を自動的に調査します。
トラブルシューティングのシナリオ例に沿って、これらのツールを組み合わせて使用し、実際のアプリケーションの障害を診断して解決する方法を学びます。
基本的な概念を理解する
Kubernetes と GKE を初めて使用する場合は、トラブルシューティングを開始する前に、クラスタ アーキテクチャや Pod とノードの関係などのコアコンセプトを理解することが不可欠です。詳細については、GKE の学習を開始するをご覧ください。
また、GKE のどの部分のメンテナンスをお客様が担当し、どの部分を Google Cloud が担当するのかを理解することも重要です。詳細については、GKE の共有責任をご覧ください。
次のステップ
Google Cloud サービスの状態とインシデントを確認する(このシリーズの次のページ)を読む。
特定の問題の解決に関するアドバイスについては、GKE のトラブルシューティング ガイドをご覧ください。
このドキュメントに問題のソリューションが見当たらない場合は、サポートを受けるで、次のトピックに関するアドバイスなど、詳細なヘルプをご覧ください。
- Cloud カスタマーケアに問い合わせて、サポートケースを登録する。
- StackOverflow で質問する、
google-kubernetes-engine
タグを使用して類似の問題を検索するなどして、コミュニティからサポートを受ける。#kubernetes-engine
Slack チャネルに参加して、コミュニティ サポートを利用することもできます。 - 公開バグトラッカーを使用して、バグの報告や機能リクエストの登録を行う。