Assistance

L'objectif principal de Google est de résoudre les incidents de production le plus rapidement possible. Pour ce faire, nous nous efforçons de comprendre votre configuration, d'analyser les journaux et les métriques et de collaborer avec nos partenaires pour résoudre rapidement les incidents.

Google Cloud propose une gamme de formules d'assistance adaptées à vos besoins. Toutes les formules d'assistance Google Cloud prennent en charge Anthos et GKE On-Prem. Si vous avez souscrit à une formule d'assistance Google Cloud, vous bénéficiez déjà d'une assistance sur Anthos et GKE On-Prem.

Pour en savoir plus, consultez la documentation de l'assistance Google Cloud.

Conditions requises pour l'assistance GKE On-Prem

Pour résoudre efficacement les incidents critiques, vous devez effectuer les actions suivantes :

  1. Vérifiez que l'environnement est à jour et que les délais de fin de service sont publiés. Consultez la section Politique de compatibilité avec les versions ci-dessous.
  2. Activez Cloud Logging et Cloud Monitoring pour les composants système. Pour en savoir plus, consultez la section Outils d'assistance.
  3. Lorsque vous ouvrez une demande d'assistance, fournissez un instantané de configuration à l'aide de la commande gkectl diagnose snapshot.

Outils d'assistance

Pour résoudre un incident GKE On-Prem, l'assistance de Google Cloud s'appuie sur trois éléments d'information :

  • La configuration de votre environnement
  • Les journaux de vos clusters d'utilisateur et d'administrateur
  • Les métriques de vos clusters d'utilisateur et d'administrateur

Configuration

Lorsque vous ouvrez une demande d'assistance, vous êtes invité à exécuter la commande gkectl diagnose snapshot --seed-config et à joindre le package tarball obtenu à la demande d'assistance. gkectl diagnose snapshot --seed-config capture des informations sur Kubernetes et vos nœuds.

L'outil propose des possibilités de configuration avancées et inclut plusieurs scénarios prédéfinis. Vous pouvez également transmettre un fichier YAML avec un ensemble personnalisé d'informations à collecter. Pour en savoir plus, consultez la section Diagnostiquer des clusters.

Vous pouvez ajouter un champ excludeWords à votre fichier de configuration pour omettre les informations sensibles ou confidentielles. Assurez-vous d'examiner attentivement les informations recueillies par l'outil. Les informations sensibles ou hautement confidentielles ne doivent pas être jointes à votre demande d'assistance.

Journaux

Lorsque vous créez un cluster GKE On-Prem, les agents Cloud Logging sont activés par défaut et ne concernent que les composants au niveau du système. Cette opération permet de répliquer les journaux système dans le projet Google Cloud associé au cluster. Les journaux au niveau du système proviennent de pods Kubernetes s'exécutant dans l'un des cinq espaces de noms suivants :

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system
  • knative-serving

Les journaux peuvent être interrogés à partir de la console Cloud Logging.

Pour en savoir plus, consultez la page Logging et Monitoring.

Métriques

En plus des journaux, les métriques sont également capturées par l'agent Cloud Monitoring. Cette opération permet de répliquer les métriques au niveau du système dans le projet Google Cloud associé au cluster. Les métriques au niveau du système proviennent de pods Kubernetes exécutés dans les mêmes espaces de noms que ceux répertoriés dans les journaux.

Pour en savoir plus, consultez la page Logging et Monitoring.

Comment nous dépannons votre environnement

Voici un exemple type d'incident nécessitant une assistance :

  1. Un utilisateur (par exemple, l'administrateur du cluster) ouvre une demande d'assistance via la console Google Cloud ou le centre d'assistance Google Cloud, et sélectionne Anthos et GKE On-Prem comme catégorie et composant respectivement. Il saisit les informations requises et joint à sa demande la sortie produite par gkectl diagnose snapshot.
  2. Cette demande d'assistance est transmise à un ingénieur d'assistance technique spécialiste de GKE On-Prem.
  3. L'ingénieur d'assistance examine le contenu de l'instantané pour connaître le contexte de l'environnement.
  4. L'ingénieur d'assistance examine les journaux et les métriques du projet Google Cloud, en saisissant le numéro de la demande d'assistance comme justification de l'entreprise, laquelle est consignée en interne.
  5. L'ingénieur d'assistance répond à la demande par une évaluation et une recommandation. L'ingénieur d'assistance et l'utilisateur continuent de tenter de résoudre le problème jusqu'à ce qu'ils trouvent une solution.

Partenaires d'assistance collaborative

Google entretient des relations d'assistance collaborative avec certains partenaires afin de proposer une assistance plus homogène sur GKE On-Prem. Grâce à ces relations, Google collabore étroitement avec ces partenaires au nom de nos clients communs.

Pour bénéficier de l'assistance collaborative, vous devez signer des contrats d'assistance avec Google et le partenaire concerné.

Google entretient actuellement une relation d'assistance collaborative avec les partenaires spécifiés sur la page Partenaires d'assistance collaborative.

Les données concernant les problèmes d'assistance peuvent être partagées avec les partenaires d'assistance collaborative, comme indiqué dans les Instructions sur les services d'assistance technique de Google.

Quelles sont les fonctionnalités acceptées par Google ?

En règle générale, l'équipe d'assistance Cloud accepte tous les composants logiciels fournis dans le cadre de GKE On-Prem et d'Istio Open Source. Consultez le tableau ci-dessous pour en savoir plus :

Assistance GCP Assistance collaborative Non compatible
Kubernetes et l'environnement d'exécution des conteneurs
VMware vSphere (vCenter Server et ESXi)
Produits VMware au-delà de vSphere
Canonical Ubuntu comme OS invité/nœud
Équilibreurs de charge F5 BIG-IP
Code client (voir Assistance aux développeurs ci-dessous)
Contrôleur vCenter
Solutions d'infrastructure matérielles et hyperconvergées, répertoriées sur la page Partenaires d'assistance collaborative
Choix de l'OS hôte par le client
Contrôleur F5

Serveur physique, stockage et réseau
Calico et règles de réseau associées

Systèmes externes de DNS, de DHCP et de gestion des identités
Contrôleur d'entrée

Calico Enterprise Edition
Prometheus et Grafana
Agents Stackdriver Monitoring, Stackdriver Logging, et Stackdriver
Fédération d'identité avec des fournisseurs conformes à la norme OIDC
Hub, Connect et agent Connect
Istio Open Source
Cloud Run/Knative

Politique de compatibilité avec les versions

La compatibilité des clusters Anthos sur VMware est conforme à la politique de compatibilité avec les versions d'Anthos. Google est compatible avec la version actuelle et les deux versions précédentes de GKE On-Prem.

Le tableau suivant présente les versions compatibles et non compatibles de ce produit.

Version Date de disponibilité Date de fin de vie la plus proche
1.15 (dernière version) 2 mai 2023 2 mai 2024
1,14 21 décembre 2022 21 décembre 2023
1,13 29 septembre 2022 17 août 2023
1.12 (non compatible) 7 juillet 2022 29 mars 2023
1.11 (non compatible) 27 avril 2022 21 décembre 2022
1.10 (non compatible) 22 décembre 2021 22 septembre 2022
1.9 (non compatible) 29 septembre 2021 29 juin 2022
1.8 (non compatible) 28 juin 2021 28 mars 2022
1.7 (non compatible) 25 mars 2021 25 décembre 2021
1.6 (non compatible) 10 décembre 2020 10 septembre 2021
1.5 (non compatible) 24 septembre 2020 24 juin 2021
1.4 (non compatible) 25 juin 2020 25 mars 2021
1.3 (non compatible) 23 mars 2020 23 décembre 2020
1.2 (non compatible) 20 décembre 2019 20 septembre 2020
1.1 (non compatible) 26 septembre 2019 26 juin 2020
1.0 (non compatible) 25 juillet 2019 25 avril 2020

Modèle de responsabilité partagée

Pour gérer une application de production critique sur GKE On-Prem, différentes responsabilités doivent être assumées par plusieurs groupes. Bien que cette liste ne soit pas exhaustive, les sections ci-dessous répertorient les rôles et les responsabilités concernés.

Responsabilités de Google

  • Maintenance et distribution du package logiciel GKE On-Prem, y compris Kubernetes, vCenter et les contrôleurs F5, le contrôleur d'entrée, les agents Connect et Stackdriver, ainsi que l'outil de ligne de commande gkectl.
  • Maintenance et distribution des images du poste de travail administrateur et de la machine de nœud Ubuntu, y compris les correctifs et les correctifs de sécurité standards.
  • Notification des utilisateurs quant aux mises à jour disponibles pour GKE On-Prem et génération des scripts de mise à jour pour la version précédente. GKE On-Prem n'accepte que les mises à jour séquentielles (1.2 → 1.3 → 1.4 uniquement, et non 1.2 → 1.4).
  • Opération des services Connect et Stackdriver.
  • Résolution des problèmes, solutions palliatives et correction de la cause principale des problèmes liés aux composants fournis par Google.

Responsabilités des utilisateurs

  • Administration globale du système pour les clusters sur site
  • Gestion de toute charge de travail d'application déployée sur le cluster
  • Exécution, maintenance et correction de l'infrastructure du centre de données, y compris les réseaux, les serveurs, le stockage et la connectivité à Google Cloud
  • Exécution, gestion et correction des équilibreurs de charge vSphere et de réseau
  • Gestion des contrats d'assistance concernant VMware et F5 (si déployés)
  • Mise à jour régulière des versions de GKE On-Prem
  • Test et déploiement des images de machine de nœud mises à jour avec les correctifs Ubuntu
  • Surveillance du cluster et des applications et réponse aux incidents éventuels
  • Déploiement des agents Cloud Logging et Stackdriver dans les clusters
  • Partage avec Google des informations concernant l'environnement à des fins de dépannage

Assistance aux développeurs

Google ne propose pas d'assistance pour les charges de travail d'applications exécutées sur GKE On-Prem. Cependant, nous proposons une assistance aux développeurs, afin que votre équipe puisse facilement exécuter des applications sur GKE On-Prem. Une implication à un stade précoce du développement peut prévenir des incidents critiques ultérieurs au cours du déploiement.

Cette assistance aux développeurs est disponible pour les clients bénéficiant d'une formule d'assistance payante. Elle est traitée en tant que P3 pour un problème bloquant un lancement, ou P4 pour une consultation générale.