Version 1.0. Cette version n'est plus compatible, comme indiqué dans la politique de compatibilité avec les versions d'Anthos. Pour obtenir les derniers correctifs et mises à jour pour les failles de sécurité, les expositions et les problèmes affectant Anthos Clusters on VMware (GKE On-Prem), passez à une version compatible. Vous trouverez la version la plus récente ici.

Obtenir de l'aide

L'objectif principal de Google est de résoudre les incidents de production le plus rapidement possible. Pour ce faire, nous nous efforçons de comprendre votre configuration, d'analyser les journaux et les métriques et de collaborer avec nos partenaires pour résoudre rapidement les incidents.

Google Cloud propose une gamme de formules d'assistance adaptées à vos besoins. Toutes les formules d'assistance Google Cloud prennent en charge Anthos et GKE On-Prem. Si vous avez souscrit à une formule d'assistance Google Cloud, vous bénéficiez déjà d'une assistance sur Anthos et GKE On-Prem.

Pour en savoir plus, consultez la documentation de l'assistance Google Cloud.

Conditions requises par l'assistance GKE On-Prem

Pour résoudre efficacement les incidents critiques, vous devez effectuer les actions suivantes :

  1. Vérifiez que l'environnement est à jour et que les délais de fin de service sont publiés. Consultez la section Politique de compatibilité avec les versions ci-dessous.
  2. Activez Cloud Logging et Cloud Monitoring pour les composants système. Pour en savoir plus, consultez la section Outils d'assistance.
  3. Lorsque vous ouvrez une demande d'assistance, fournissez un instantané de configuration à l'aide de la commande gkectl diagnose snapshot.

Outils d'assistance

Pour résoudre un incident GKE On-Prem, l'assistance de Google Cloud s'appuie sur trois éléments d'information :

  • La configuration de votre environnement
  • Les journaux de vos clusters d'utilisateur et d'administrateur
  • Les métriques de vos clusters d'utilisateur et d'administrateur

Configuration

Lorsque vous ouvrez une demande d'assistance, vous êtes invité à exécuter la commande gkectl diagnose snapshot et à joindre le package tarball obtenu à la demande d'assistance. gkectl diagnose snapshot exécute un certain nombre de commandes différentes pour capturer des informations sur Kubernetes et vos nœuds.

L'outil propose des possibilités de configuration avancées et inclut plusieurs scénarios prédéfinis. Vous pouvez également transmettre un fichier YAML avec un ensemble personnalisé d'informations à collecter. Pour en savoir plus, consultez la section Diagnostiquer des clusters.

Vous pouvez ajouter un champ excludeWords à votre fichier de configuration pour omettre les informations sensibles ou confidentielles. Assurez-vous d'examiner attentivement les informations recueillies par l'outil. Les informations sensibles ou hautement confidentielles ne doivent pas être jointes à votre demande d'assistance.

Journaux

Lorsque vous créez un cluster GKE On-Prem, les agents Cloud Logging sont activés par défaut et ne concernent que les composants au niveau du système. Cette opération permet de répliquer les journaux système dans le projet Google Cloud associé au cluster. Les journaux au niveau du système proviennent de pods Kubernetes s'exécutant dans l'un des cinq espaces de noms suivants :

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system

Les journaux peuvent être interrogés à partir de la console Cloud Logging.

Pour en savoir plus, consultez la page Logging et Monitoring.

Métriques

En plus des journaux, les métriques sont également capturées par l'agent Cloud Monitoring. Cette opération permet de répliquer les métriques au niveau du système dans le projet Google Cloud associé au cluster. Les métriques au niveau du système proviennent de pods Kubernetes exécutés dans les mêmes espaces de noms que ceux répertoriés dans les journaux.

Pour en savoir plus, consultez la page Logging et Monitoring.

Comment nous dépannons votre environnement

Voici un exemple type d'incident nécessitant une assistance :

  1. Quelqu'un (par exemple, l'administrateur du cluster) ouvre une demande d'assistance via Cloud Console ou le Centre d'assistance Google Cloud, puis sélectionne la catégorie Anthos et le composant GKE On-Prem. Cette personne saisit les informations requises et joignent la sortie produite par gkectl diagnose snapshot à sa demande.
  2. Cette demande d'assistance est transmise à un ingénieur d'assistance technique spécialiste de GKE On-Prem.
  3. L'ingénieur d'assistance examine le contenu de l'instantané pour connaître le contexte de l'environnement.
  4. L'ingénieur d'assistance examine les journaux et les métriques du projet Google Cloud, en saisissant le numéro de la demande d'assistance comme justification de l'entreprise, laquelle est consignée en interne.
  5. L'ingénieur d'assistance répond à la demande par une évaluation et une recommandation. L'ingénieur d'assistance et l'utilisateur continuent de tenter de résoudre le problème jusqu'à ce qu'ils trouvent une solution.

Partenaires d'assistance collaborative

Google entretient des relations d'assistance collaborative avec certains partenaires afin de proposer une assistance plus homogène sur GKE On-Prem. Grâce à ces relations, Google collabore étroitement avec ces partenaires au nom de nos clients communs.

Pour bénéficier de l'assistance collaborative, vous devez signer des contrats d'assistance avec Google et le partenaire concerné.

Google entretient actuellement une relation d'assistance collaborative avec les partenaires spécifiés sur la page Partenaires d'assistance collaborative.

Les données concernant les problèmes d'assistance peuvent être partagées avec les partenaires d'assistance collaborative, comme indiqué dans les Instructions sur les services d'assistance technique de Google.

Quelles sont les fonctionnalités pour lesquelles Google propose une assistance ?

En règle générale, l'équipe d'assistance Cloud prend en charge tous les composants logiciels inclus dans GKE On-Prem, ainsi que les composants Open Source d'Istio. Consultez le tableau ci-dessous pour en savoir plus :

Assistance GCP Assistance collaborative Non compatible
Kubernetes et l'environnement d'exécution des conteneurs
VMware vSphere (vCenter Server et ESXi)
Produits VMware au-delà de vSphere
Canonical Ubuntu comme OS invité/nœud
Équilibreurs de charge F5 BIG-IP
Code client (voir Assistance aux développeurs ci-dessous)
Contrôleur vCenter
Solutions d'infrastructure matérielles et hyperconvergées, répertoriées sur la page Partenaires d'assistance collaborative
Choix de l'OS hôte par le client
Contrôleur F5

Serveur physique, stockage et réseau
Calico et règles de réseau associées

Systèmes externes de DNS, de DHCP et de gestion des identités
Contrôleur d'entrée

Calico Enterprise Edition
Prometheus et Grafana
Agents Stackdriver Monitoring, Stackdriver Logging, et Stackdriver
Fédération d'identité avec des fournisseurs conformes à la norme OIDC
Hub, Connect et agent Connect
Composants Open Source d'Istio

Politique de compatibilité avec les versions

Pour en savoir plus sur la politique générale de compatibilité avec les versions, consultez la page d'assistance Anthos.

Modèle de responsabilité partagée

Pour gérer une application de production critique sur GKE On-Prem, les responsabilités doivent être partagées par plusieurs groupes. Bien que cette liste ne soit pas exhaustive, les sections ci-dessous répertorient les rôles et les responsabilités concernés.

Responsabilités de Google

  • Maintenance et distribution du package logiciel GKE On-Prem, y compris Kubernetes, vCenter et les contrôleurs F5, le contrôleur d'entrée, les agents Connect et Stackdriver, ainsi que l'outil de ligne de commande gkectl.
  • Maintenance et distribution des images du poste de travail administrateur et de la machine de nœud Ubuntu, y compris les correctifs et les correctifs de sécurité standards.
  • Notification des utilisateurs quant aux mises à jour disponibles pour GKE On-Prem et génération des scripts de mise à jour pour la version précédente. GKE On-Prem n'accepte que les mises à jour séquentielles (1.2 → 1.3 → 1.4 uniquement, et non 1.2 → 1.4).
  • Opération des services Connect et Stackdriver.
  • Résolution des problèmes, solutions palliatives et correction de la cause principale des problèmes liés aux composants fournis par Google.

Responsabilités des utilisateurs

  • Administration globale du système pour les clusters sur site
  • Gestion de toute charge de travail d'application déployée sur le cluster
  • Exécution, maintenance et correction de l'infrastructure du centre de données, y compris les réseaux, les serveurs, le stockage et la connectivité à Google Cloud
  • Exécution, gestion et correction des équilibreurs de charge vSphere et de réseau
  • Gestion des contrats d'assistance concernant VMware et F5 (si déployés)
  • Mise à jour régulière des versions de GKE On-Prem.
  • Test et déploiement des images de machine de nœud mises à jour avec les correctifs Ubuntu
  • Surveillance du cluster et des applications et réponse aux incidents éventuels
  • Déploiement des agents Cloud Logging et Stackdriver dans les clusters
  • Partage avec Google des informations concernant l'environnement à des fins de dépannage

Assistance aux développeurs

Google ne propose pas d'assistance pour les charges de travail d'applications exécutées sur GKE On-Prem. Cependant, nous proposons une assistance aux développeurs, afin que votre équipe puisse facilement exécuter des applications sur GKE On-Prem. Une implication à un stade précoce du développement peut prévenir des incidents critiques ultérieurs au cours du déploiement.

Cette assistance aux développeurs est disponible pour les clients bénéficiant d'une formule d'assistance payante. Elle est traitée en tant que P3 pour un problème bloquant un lancement, ou P4 pour une consultation générale.