Google の主要なサポート目標は、本番環境でのインシデントをできるだけ迅速に解決することです。お客様の構成を把握し、ログと指標を分析して、パートナーと協力することにより、インシデントを迅速に解決します。
Google Cloud は、さまざまなサポート パッケージを備えており、お客様のサポートニーズにお応えします。すべての Google Cloud サポート パッケージには、Google Kubernetes Engine(GKE)Enterprise エディションと Google Distributed Cloud のサポートが含まれています。既存の Google Cloud サポート パッケージをご利用の場合は、GKE Enterprise と Google Distributed Cloud のサポートがすでに含まれています。
詳細については、Google Cloud サポートのドキュメントをご覧ください。
Google Distributed Cloud サポートの要件
ビジネス クリティカルなインシデントを効果的にトラブルシューティングするには:
- ご利用の環境が現行バージョンで、公開されているサポート期間内であることを確認します。詳細については、バージョン サポート ポリシーをご覧ください。
- システム コンポーネントに対する Cloud Logging と Cloud Monitoring を有効にします。詳しくは、次のサポートツール セクションをご覧ください。
サポートツール
Google Distributed Cloud インシデントのトラブルシューティングでは、Google Cloud サポートで、次の 3 つの情報を使用します。
環境の構成
サポートケースを登録するにあたり、次のコマンドを実行するとクラスタの設定に関する重要な情報を取得できます。
すべてのクラスタタイプで、
bmctl check cluster --snapshot
コマンドを実行して Kubernetes とノードに関する情報を取得します。作成された tar ファイルをサポートケースに添付してください。管理クラスタ、ハイブリッド クラスタ、スタンドアロン クラスタの場合は、
bmctl check cluster
コマンドを実行してクラスタとノードのステータスを確認します。生成されたログをサポートケースに添付してください。ログはbmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
ディレクトリの下にあります。ユーザー クラスタの場合は、まずクラスタ名と Namespace を含むヘルスチェック YAML ファイルを作成し、次に適切な管理クラスタにファイルを適用します。
次の
healthcheck
プロパティが記述された YAML ファイルを作成します。cluster-user1
Namespace のuser1
という名前のクラスタに対する記述例を、次に示します。apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
YAML ファイルを作成したら、
kubectl
コマンドを使用して、ユーザー クラスタを管理する管理クラスタにその YAML ファイルを適用します。前の手順で作成した YAML ファイルを使用したコマンドの例を次に示します。この例では、ADMIN_KUBECONFIG
変数は管理クラスタの kubeconfig ファイルのパスを指定します。kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
このコマンドは、次のレスポンスを返します。
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
ヘルスチェック ジョブの調整が終了したかどうかを確認するテストを実施し、ヘルスチェック ジョブが完了するのを待ちます。前述の例では、ヘルスチェック ジョブの名前は
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
です。kubectl
コマンドを使用したテストの例を次に示します。これは、ヘルスチェック ジョブが完了するまで 30 分待機します。kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
完了すると、このコマンドは次の情報を返します。
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
ヘルスチェック ジョブの結果は、次のコマンドで表示されます。
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
このコマンドは、次の結果を返します。
NAME PASS AGE healthcheck-7c4qf true 17m
kubectl
コマンドを使用して、ヘルスチェック ジョブの Pod のログをすべてローカル ファイルに収集します。前述のサンプル ヘルスチェック ジョブを使用した例を次に示します。kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
クラスタログ
新しい Google Distributed Cloud クラスタを作成すると、Cloud Logging エージェントがデフォルトで有効になり、システムレベルのコンポーネントのみが対象となります。これにより、クラスタに関連付けられた Google Cloud プロジェクトにシステムレベルのログが複製されます。システムレベルのログは、次の Namespace にある Kubernetes Pod から取得されます。
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
ログに対するクエリは、Cloud Logging コンソールから実行できます。
詳細については、Logging と Monitoring をご覧ください。
Google Cloud CLI とリモートでのクラスタ アクセス
サポートケースを開くと、Cloud カスタマーケアから、問題をより効果的に診断して解決するために、クラスタへのリモートによる読み取り専用アクセス権が求められることがあります。サポートチームがクラスタの問題をリモートでトラブルシューティングするのに十分なアクセス権を得るには、Google Cloud CLI の最新バージョンがインストールされていることを確認してください。Cloud カスタマーケアに必要な権限を付与するには、Google Cloud CLI がバージョン 401.0.0 以上である必要があります。Google Cloud CLI を定期的に更新して、追加された権限やその他の機能強化を利用できるようにしておくことをおすすめします。
gcloud CLI の最新コンポーネントをインストールするには、gcloud
components update
コマンドを使用します。クラスタへのリモート読み取り専用アクセスを Cloud カスタマーケアに付与する方法については、登録済みクラスタの Google Cloud サポートをご覧ください。
クラスタ指標
ログに加えて、Cloud Monitoring エージェントは指標もキャプチャします。これにより、クラスタに関連付けられた Google Cloud プロジェクトにシステムレベルの指標が複製されます。システムレベルの指標は、ログに記載されているものと同じ Namespace で実行されている Kubernetes Pod から取得されます。
詳細については、Logging と Monitoring をご覧ください。
環境のトラブルシューティング方法
一般的なサポート インシデントの例を次に示します。
クラスタ管理者が Google Cloud コンソールまたは Google Cloud サポート センターでサポートケースを開き、Google Kubernetes Engine(GKE)Enterprise エディションと Google Distributed Cloud をそれぞれカテゴリとコンポーネントとして選択します。必要な情報を入力し、関連する
bmctl
コマンドの出力をケースに添付します。サポートケースは、Google Distributed Cloud を専門とするテクニカル サポート エンジニアに転送されます。
サポート エンジニアはスナップショットの内容を調べ、環境のコンテキストを取得します。
サポート エンジニアは、Google Cloud プロジェクトのログと指標を調べて、業務上の正当な理由としてサポートケース ID を入力します。これは、内部でログに記録されます。
サポート エンジニアは、ケースに評価と推奨事項を返信します。サポート エンジニアとユーザーは、解決するまでトラブルシューティングを続けます。
Google のサポート範囲
通常、Cloud サポートチームは、Google Distributed Cloud および Cloud Service Mesh の一部としてリリースされるすべてのソフトウェア コンポーネント、Policy Controller、Config Sync、Config Controller をサポートしています。次の表に、サポートされている機能とサポートされていない機能の詳細なリストを示します。
Google Cloud のサポート対象 | サポート対象外 |
---|---|
Kubernetes とコンテナ ランタイム | お客様が選択したロードバランサ(手動負荷分散) |
Connect と Connect Agent | お客様コード(デベロッパー サポートを参照) |
Google Cloud Operations、Monitoring、Logging、エージェント | お客様が選択したオペレーティング システム |
バンドルされたロードバランサ | 物理サーバー、仮想サーバー、ストレージ、ネットワーク |
Ingress コントローラ | 外部の DNS、DHCP、ID システム |
GKE Identity Service | |
Cloud Service Mesh | |
Policy Controller | |
Config Sync | |
Config Controller |
バージョンのサポート ポリシー
Google Distributed Cloud のサポートは、GKE Enterprise サポート ポリシーに従って提供されます。Google は、以下のいずれか長いほうの期間にわたって、Google Distributed Cloud の各マイナー バージョンをサポートします。
- マイナー バージョンの最初のリリースから 12 か月間。
- 3 番目のマイナー バージョンのリリース。
サポートされている Google Distributed Cloud バージョンとサポートされていないバージョンのリストについては、バージョニングをご覧ください。
クラスタのアップグレードに関連するバージョン情報については、アップグレードのバージョン ルールをご覧ください。
サポートされている機能
このドキュメントでは、Google Distributed Cloud のサポート対象のリリースで使用できる特徴と機能について説明します。この表は、すべてを網羅するものではありませんが、クラスタをサポートされている最新バージョンにアップグレードすることのいくつかの利点を示しています。
プレビュー版として表示されている機能には、Google Cloud 利用規約の Pre-GA サービス規約が適用されます。pre-GA のプロダクトと機能では、サポートが制限されることがあります。また、pre-GA のプロダクトや機能の変更は、他の pre-GA のバージョンと互換性がない場合があります。詳細については、リリース ステージの説明をご覧ください。プレビュー版のサービスは、テスト環境のみで使用することを前提としています。
一般提供(GA)としてリストされた機能は完全にサポートされており、すべてのお客様に公開され、本番環境で使用できる状態になっています。
機能 / 性能 | 1.15(サポート対象外) | 1.16 | 1.28 | 1.29(最新) |
---|---|---|---|---|
複数のユーザー クラスタ バージョンの管理クラスタのサポート | - | - | - | プレビュー |
アラート ポリシー | プレビュー | プレビュー | プレビュー | プレビュー |
Google Distributed Cloud 上の VM ランタイム | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
Azure Active Directory(AD)グループ | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
BGP ベース ロードバランサの IPv6 のサポート | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
Binary Authorization | プレビュー | 一般提供 | 一般提供 | 一般提供 |
BGP によるバンドル型ロード バランシング | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
Cloud Audit Logging | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
クラスタのバックアップと復元の CLI サポート | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
クラスタ認証局(CA)のローテーション | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
クラスタノード リセット CLI サポート | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
クラスタ アップグレードの一時停止と再開 | - | - | プレビュー | プレビュー |
containerd コンテナ ランタイム | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
コントロール グループ v2 | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
カスタム認証局 | - | プレビュー | 一般提供 | 一般提供 |
Dataplane V2 Direct Server Return(DSR)ロード バランシング転送モード | - | プレビュー | 一般提供 | 一般提供 |
Border Gateway Protocol(BGP)を使用した動的フラット IP | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
下り(外向き)NAT ゲートウェイ | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
フラット IPv4 モード(静的) | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
フラット IPv6 サポート(BGP モード) | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
GKE Identity Service v2 | - | - | プレビュー | 一般提供 |
IPv4 / IPv6 デュアル スタック | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
KSA サポート | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
Google Cloud Managed Service for Prometheus 向けマネージド コレクタ | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
マルチクラスタ接続 | プレビュー | プレビュー | プレビュー | プレビュー |
Pod のマルチ NIC | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
GDC 用ネットワーク ゲートウェイ | プレビュー | プレビュー | プレビュー | プレビュー |
ノードの問題の検出機能 | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
ノードの並列アップグレード | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
ノードプールの並列アップグレード | プレビュー | 一般提供 | 一般提供 | 一般提供 |
パフォーマンス調整オペレーター | - | プレビュー | プレビュー | プレビュー |
ノードの限定公開レジストリのサポート | - | - | - | プレビュー |
レジストリ ミラーのサポート | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
安全なコンピューティング モード(seccomp) | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
ノードプールのバージョン アップグレードをスキップする | - | - | プレビュー | 一般提供 |
SR-IOV ネットワーキング | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
API 指標の概要 | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
VPC Service Controls | プレビュー | 一般提供 | 一般提供 | 一般提供 |
ワーカー ノードプールのアップグレードのロールバック | - | - | - | プレビュー |
Workload Identity | 一般提供 | 一般提供 | 一般提供 | 一般提供 |
共有責任モデル
Google Distributed Cloud でビジネス クリティカルな本番環境アプリケーションを実行するには、複数の当事者がそれぞれの責任を果たす必要があります。完全なリストではありませんが、以下のセクションで一部の役割と責任について説明します。
Google の責任
- Google Distributed Cloud ソフトウェア パッケージのメンテナンスと配布。
- Google Distributed Cloud の利用可能なアップグレードについてユーザーに通知し、以前のバージョンのアップグレード スクリプトを作成します。Google Distributed Cloud は、順次アップグレードのみをサポートします(例: 1.2 → 1.3 → 1.4 がサポートされ、1.2 → 1.4 はサポートされません)。
- Connect サービスと Cloud Operations サービスの運用
- Google 提供のコンポーネントに関連するトラブルシューティング、回避策の提供、問題の根本原因の修正。
ユーザーの責任
- オンプレミス クラスタの全体的なシステム管理。
- クラスタにデプロイされたアプリケーション ワークロードのメンテナンス。
- データセンター インフラストラクチャ(ネットワーク、サーバー、オペレーティング システム、ストレージ、Google Cloud への接続など)の実行、保守、パッチ適用。
- 手動のロードバランサ オプションが採用されている場合、ネットワーク ロードバランサの実行、保守、パッチ適用。
- Google Distributed Cloud のバージョンを定期的にアップグレードします。
- クラスタとアプリケーションのモニタリング、およびインシデントへの対応。
- Cloud Operations エージェントのクラスタへの確実なデプロイ。
- トラブルシューティング目的での、Google への環境の詳細の提供。
デベロッパー サポート
Google は、デベロッパーのアプリケーション ワークロードに特化したサポートは提供していません。ただし、デベロッパーが Google Distributed Cloud でアプリケーションを簡単に実行できるように、ベスト エフォート型のデベロッパー サポートを提供しています。開発の段階での早期の取り組みにより、後のデプロイの段階での重大なインシデントを防ぐことができると Google は考えています。
このベスト エフォートのデベロッパー サポートは、有料サポート パッケージをご利用のすべてのお客様に提供されます。また、リリースに支障が生じる問題を優先度 P3、一般的な問い合わせを優先度 P4 として取り扱います。この分類では、優先度 0 が最高の優先度です。