Assistance

L'objectif principal de Google est de résoudre les incidents de production le plus rapidement possible. Pour ce faire, nous nous efforçons de comprendre votre configuration, d'analyser les journaux et les métriques et de collaborer avec nos partenaires pour résoudre rapidement les incidents.

Google Cloud propose une gamme de formules d'assistance adaptées à vos besoins. Toutes les formules d'assistance Google Cloud sont compatibles avec Anthos. Si vous avez souscrit à une formule d'assistance Google Cloud, vous bénéficiez déjà de la compatibilité avec Anthos.

Pour en savoir plus, consultez la documentation de l'assistance Google Cloud.

Conditions requises pour l'assistance Anthos

Pour résoudre efficacement les incidents critiques, vous devez effectuer les actions suivantes :

  • Vérifiez que votre environnement est à jour et conforme aux délais de fin de service publiés. Pour plus d'informations, consultez la section Politique de compatibilité avec les versions.
  • Capturez les données de journalisation et les configurations des composants système. Pour en savoir plus, consultez la section Outils d'assistance suivante.

Outils d'assistance

Pour résoudre un incident lié au mode déconnecté d'Anthos, l'assistance Google Cloud s'appuie sur la configuration de votre environnement et les journaux de vos clusters. Vous pouvez capturer l'état de votre cluster à l'aide de la commande actl diagnose et empaqueter cette information dans un fichier d'archive TAR pour interagir avec l'assistance. Consultez la page Diagnostiquer les problèmes de cluster.

Comment nous dépannons votre environnement

Voici un exemple type d'incident nécessitant une assistance :

  1. Un utilisateur, par exemple, un administrateur de plate-forme, ouvre une demande d'assistance auprès de l'opérateur d'infrastructure du mode déconnecté d'Anthos.
  2. L'opérateur d'infrastructure fournit une assistance de niveau 1, qui implique la consultation de la documentation, des guides d'utilisation et des questions d'ordre général sur les produits.
  3. L'administrateur de la plate-forme capture l'instantané du système de diagnostic sur une période appropriée pour les composants système pertinents. L'opérateur d'infrastructure nettoie également les données de l'instantané en supprimant toutes les informations sensibles de celui-ci et partage l'instantané avec l'opérateur d'infrastructure. L'opérateur d'infrastructure peut également prendre un instantané pour récupérer des informations de débogage supplémentaires.
  4. Si le problème n'est pas résolu, l'opérateur d'infrastructure fournit également une assistance de niveau 2, qui implique la résolution des problèmes courants à l'aide de la télémétrie et de l'analyse de l'instantané du système et/ou de playbooks.
  5. Pour les problèmes plus complexes, l'opérateur d'infrastructure ouvre une demande auprès de l'assistance Google Cloud et partage l'instantané du système nettoyé avec l'assistance Google.
  6. Cette demande d'assistance est transmise à un ingénieur d'assistance technique spécialiste d'Anthos en mode déconnecté, qui comprend la mise en œuvre et l'architecture du produit, ainsi que l'origine de nouveaux problèmes.
  7. L'ingénieur d'assistance technique examine le contenu des instantanés de diagnostic pour connaître le contexte de l'environnement. L'ingénieur d'assistance technique examine les journaux et les métriques, et consigne leurs analyses et leurs données contextuelles dans la demande. L'ingénieur d'assistance peut demander des informations supplémentaires, telles que la sortie des commandes actl pertinentes, et les associer à la demande.
  8. L'ingénieur d'assistance technique peut également faire appel aux équipes d'ingénierie Google si nécessaire pour résoudre des problèmes plus complexes, tels que des corrections de bugs et des modifications de mise en œuvre.
  9. L'ingénieur d'assistance répond à la demande par une évaluation et une recommandation. L'ingénieur d'assistance et l'opérateur de l'infrastructure Anthos en mode déconnecté continuent de tenter de résoudre le problème jusqu'à ce qu'ils trouvent une solution.

Quelles sont les fonctionnalités acceptées par Google ?

En règle générale, l'équipe d'assistance Cloud accepte tous les composants logiciels intégrés au mode déconnecté d'Anthos, ainsi qu'Anthos, Anthos Service Mesh et Anthos Config Management. Consultez le tableau ci-dessous pour en savoir plus :

Compatibilité Google Cloud Non compatible
Kubernetes et l'environnement d'exécution des conteneurs Choix de l'équilibreur de charge (équilibrage de charge manuel) par le client
Clusters Anthos sur Bare Metal Code client (voir Assistance aux développeurs ci-dessous)
Surveillance, journalisation avec Prometheus, Loki et Grafana Choix du système d'exploitation par le client
Équilibreur de charge groupé (MetalLB) Serveur physique ou virtuel, stockage et réseau
Contrôleur d'entrée Systèmes externes de DNS, de DHCP et de gestion des identités
Anthos Identity Service
Anthos Service Mesh
Anthos Config Management

Politique de compatibilité avec les versions

Pour en savoir plus sur la politique générale de compatibilité avec les versions, consultez la page d'assistance Anthos.

Modèle de responsabilité partagée

Pour gérer une application de production critique sur des clusters Anthos, différentes responsabilités doivent être assumées par plusieurs groupes. Bien que cette liste ne soit pas exhaustive, les sections ci-dessous répertorient les rôles et les responsabilités concernés.

Responsabilités de Google

  • Maintenance et distribution des packages logiciels Anthos en mode déconnecté.
  • Notification des utilisateurs quant aux mises à jour disponibles pour Anthos en mode déconnecté et génération des scripts de mise à jour pour la version précédente d'Anthos en mode déconnecté, qui n'accepte que les mises à jour séquentielles (par exemple : 1,2 → 1,3 → 1,4, et non 1,2 → 1,4).
  • Résolution des problèmes, solutions palliatives et correction de la cause principale des problèmes liés aux composants fournis par Google.

Responsabilités de l'opérateur d'infrastructure du mode déconnecté d'Anthos

  • Administration globale du système pour les clusters d'administrateur sur site
  • Exécution, maintenance et correction de l'infrastructure du centre de données, y compris les réseaux, les serveurs, le système d'exploitation et le stockage
  • Mise à jour régulière d'Anthos en mode déconnecté
  • Surveillance du cluster, réponse aux incidents éventuels, et assistance de niveau 1 et 2 aux clients
  • Nettoyage des instantanés du système de diagnostic, de la configuration et des journaux, et vérification qu'aucune donnée sensible n'est partagée avec Google
  • Partage avec Google des informations concernant l'environnement à des fins de dépannage

Responsabilités de l'administrateur de plate-forme du mode déconnecté d'Anthos

  • Administration globale du système pour les clusters d'utilisateur sur site
  • Exécution, maintenance et correction des charges de travail de l'application
  • Surveillance des charges de travail de l'application et de l'état des clusters, et journalisation des activités du système si nécessaire pour répondre aux exigences de conformité
  • Nettoyage des instantanés du système de diagnostic, de la configuration et des journaux, et vérification qu'aucune donnée sensible n'est partagée avec Google
  • Partage avec Google des informations concernant l'environnement à des fins de dépannage

Assistance aux développeurs

Google ne propose pas d'assistance pour les charges de travail d'applications exécutées sur Anthos. Cependant, nous proposons une assistance aux développeurs, afin que votre équipe puisse facilement exécuter des applications sur Anthos en mode déconnecté. Une implication à un stade précoce du développement peut prévenir des incidents critiques ultérieurs au cours du déploiement.

Cette assistance aux développeurs est disponible pour les clients bénéficiant d'une formule d'assistance payante. Elle est traitée en tant que priorité P3 pour un problème bloquant un lancement, ou P4 pour une consultation générale.