L'objectif principal de Google est de résoudre les incidents de production le plus rapidement possible. Pour ce faire, nous nous efforçons de comprendre votre configuration, d'analyser les journaux et les métriques et de collaborer avec nos partenaires pour résoudre rapidement les incidents.
Google Cloud propose une gamme de formules d'assistance adaptées à vos besoins. Toutes les formules d'assistance Google Cloud sont compatibles avec Anthos et son mode privé. Si vous avez souscrit à une formule d'assistance Google Cloud, vous bénéficiez déjà de la compatibilité avec Anthos et son mode privé.
Pour en savoir plus, consultez la documentation de l'assistance Google Cloud.
Configuration requise pour la compatibilité avec le mode privé d'Anthos
Pour résoudre efficacement les incidents critiques, vous devez effectuer les actions suivantes :
- Vérifiez que votre environnement est à jour et conforme aux délais de fin de service publiés. Pour plus d'informations, consultez la section Politique de compatibilité avec les versions.
- Capturez les données de journalisation et les configurations des composants système. Pour en savoir plus, consultez la section Outils d'assistance suivante.
Outils d'assistance
Pour résoudre un incident lié au mode privé d'Anthos, l'assistance Google Cloud s'appuie sur la configuration de votre environnement et les journaux de vos clusters. Vous pouvez capturer l'état de votre cluster à l'aide de la commande actl diagnose
et empaqueter cette information dans un fichier d'archive TAR pour interagir avec l'assistance. Consultez la page Diagnostiquer les problèmes de cluster.
Comment nous dépannons votre environnement
Voici un exemple type d'incident nécessitant une assistance :
- Un utilisateur, par exemple, un administrateur de plate-forme, ouvre une demande d'assistance auprès de l'opérateur d'infrastructure du mode privé d'Anthos.
- L'opérateur d'infrastructure fournit une assistance de niveau 1, qui implique la consultation de la documentation, des guides d'utilisation et des questions d'ordre général sur les produits.
- L'administrateur de la plate-forme capture l'instantané du système de diagnostic sur une période appropriée pour les composants système pertinents. L'opérateur d'infrastructure nettoie également les données de l'instantané en supprimant toutes les informations sensibles de celui-ci et partage l'instantané avec l'opérateur d'infrastructure. L'opérateur d'infrastructure peut également prendre un instantané pour récupérer des informations de débogage supplémentaires.
- Si le problème n'est pas résolu, l'opérateur d'infrastructure fournit également une assistance de niveau 2, qui implique la résolution des problèmes courants à l'aide de la télémétrie et de l'analyse de l'instantané du système et/ou de playbooks.
- Pour les problèmes plus complexes, l'opérateur d'infrastructure ouvre une demande auprès de l'assistance Google Cloud et partage l'instantané du système nettoyé avec l'assistance Google.
- Cette demande d'assistance est transmise à un ingénieur d'assistance technique spécialiste du mode privé d'Anthos, qui comprend la mise en œuvre et l'architecture du produit, et est en mesure d'identifier la cause de nouveaux problèmes.
- L'ingénieur d'assistance technique examine le contenu des instantanés de diagnostic pour connaître le contexte de l'environnement. L'ingénieur d'assistance technique examine les journaux et les métriques, et consigne leurs analyses et leurs données contextuelles dans la demande. L'ingénieur d'assistance peut demander des informations supplémentaires, telles que la sortie des commandes
actl
pertinentes, et les associer à la demande. - L'ingénieur d'assistance technique peut également faire appel aux équipes d'ingénierie Google si nécessaire pour résoudre des problèmes plus complexes, tels que des corrections de bugs et des modifications de mise en œuvre.
- L'ingénieur d'assistance répond à la demande par une évaluation et une recommandation. L'ingénieur d'assistance et l'opérateur d'infrastructure du mode privé d'Anthos continuent de tenter de résoudre le problème jusqu'à ce qu'ils trouvent une solution.
Quelles sont les fonctionnalités acceptées par Google ?
En règle générale, l'équipe d'assistance Cloud accepte tous les composants logiciels intégrés au mode privé d'Anthos, ainsi qu'Anthos, Anthos Service Mesh et Anthos Config Management. Consultez le tableau ci-dessous pour en savoir plus :
Compatibilité Google Cloud | Non compatible |
---|---|
Kubernetes et l'environnement d'exécution des conteneurs | Choix de l'équilibreur de charge (équilibrage de charge manuel) par le client |
Clusters Anthos sur Bare Metal | Code client (voir Assistance aux développeurs ci-dessous) |
Surveillance, journalisation avec Prometheus, Loki et Grafana | Choix du système d'exploitation par le client |
Équilibreur de charge groupé (MetalLB) | Serveur physique ou virtuel, stockage et réseau |
Contrôleur d'entrée | Systèmes externes de DNS, de DHCP et de gestion des identités |
Anthos Identity Service | |
Anthos Service Mesh | |
Anthos Config Management |
Politique de compatibilité avec les versions
Pour en savoir plus sur la politique générale de compatibilité avec les versions, consultez la page d'assistance Anthos.
Modèle de responsabilité partagée
Pour gérer une application de production critique sur les clusters Anthos en mode privé, plusieurs groupes doivent assumer différentes responsabilités. Bien que cette liste ne soit pas exhaustive, les sections ci-dessous répertorient les rôles et les responsabilités concernés.
Responsabilités de Google
- Maintenance et distribution des packages logiciels Anthos en mode privé.
- Notification des utilisateurs quant aux mises à niveau disponibles pour le mode privé d'Anthos et génération des scripts de mise à niveau pour la version précédente. Le mode privé d'Anthos n'accepte que les mises à niveau séquentielles (par exemple : 1.2 → 1.3 → 1.4, et non 1.2 → 1.4).
- Résolution des problèmes, solutions palliatives et correction de la cause principale des problèmes liés aux composants fournis par Google.
Responsabilités de l'opérateur d'infrastructure du mode privé d'Anthos
- Administration globale du système pour les clusters d'administrateur sur site
- Exécution, maintenance et correction de l'infrastructure du centre de données, y compris les réseaux, les serveurs, le système d'exploitation et le stockage
- Mise à jour régulière des versions d'Anthos en mode privé
- Surveillance du cluster, réponse aux incidents éventuels, et assistance de niveau 1 et 2 aux clients
- Nettoyage des instantanés du système de diagnostic, de la configuration et des journaux, et vérification qu'aucune donnée sensible n'est partagée avec Google
- Partage avec Google des informations concernant l'environnement à des fins de dépannage
Responsabilités de l'administrateur de plate-forme du mode privé d'Anthos
- Administration globale du système pour les clusters d'utilisateur sur site
- Exécution, maintenance et correction des charges de travail de l'application
- Surveillance des charges de travail de l'application et de l'état des clusters, et journalisation des activités du système si nécessaire pour répondre aux exigences de conformité
- Nettoyage des instantanés du système de diagnostic, de la configuration et des journaux, et vérification qu'aucune donnée sensible n'est partagée avec Google
- Partage avec Google des informations concernant l'environnement à des fins de dépannage
Assistance aux développeurs
Google ne propose pas d'assistance pour les charges de travail d'applications exécutées sur Anthos en mode privé. Cependant, nous proposons une assistance aux développeurs, afin que votre équipe puisse facilement exécuter des applications sur Anthos en mode privé. Une implication à un stade précoce du développement peut prévenir des incidents critiques ultérieurs au cours du déploiement.
Cette assistance aux développeurs est disponible pour les clients bénéficiant d'une formule d'assistance payante. Elle est traitée en tant que priorité P3 pour un problème bloquant un lancement, ou P4 pour une consultation générale.