Surveillance dans un environnement de solution Bare Metal

La solution Bare Metal vous permet d'exécuter des charges de travail spécialisées dans des extensions régionales situés à proximité des centres de données Google Cloud. En implémentant une solution Bare Metal vous pouvez réduire les coûts globaux et les risques associés la migration vers le cloud.

Présentation de la surveillance

L'une de nos principales priorités est de proposer la disponibilité la plus élevée possible pour l'environnement de solution Bare Metal. Pour cette raison, Google Cloud et ses partenaires effectuent diverses activités de surveillance. La Voici une liste des appareils d'infrastructure dans une solution Bare Metal que nous surveillons:

Infrastructure de calcul

  • Matériel du serveur

Infrastructure de stockage

  • Périphériques de stockage
  • Commutateurs SAN

Infrastructure réseau

  • Routeurs
  • Commutateurs
  • Infrastructure d'interconnexion

Google Cloud assure également le suivi de l'environnement du centre de données, y compris la température et l'humidité de la salle de serveurs.

Nous ne surveillons pas les systèmes d'exploitation, l'activité et les charges de travail au niveau des applications, et le trafic réseau vers et depuis les serveurs de la solution Bare Metal. Pour obtenir un aperçu d'un utilitaire qui vous permet d'utiliser Cloud Operations pour surveiller l'activité au niveau de l'OS, contactez l'équipe commerciale Google Cloud.

Outils de surveillance

Notre partenaire utilise des solutions logicielles de qualité professionnelle pour surveiller la conformité avec la bibliothèque ITIL (Information Technology Infrastructure Library). Google Cloud et notre partenaire utilisent également les services Google Cloud, tels que Pub/Sub, les fonctions Cloud Run et Cloud Monitoring, pour collecter et traiter ces données de surveillance. Nos systèmes internes de gestion des demandes et des notifications fonctionnent directement avec ces services.

Données de surveillance

Dans les grandes lignes, nos données de surveillance proviennent des sources suivantes:

  • Problèmes SNMP
  • Messages Syslog
  • Messages provenant d’un logiciel de gestion dédié
  • IPMI (Intelligent Platform Management Interface)

Métriques courantes des appareils surveillés:

  • Utilisation du processeur
  • Interface réseau:
    • Utilisation de la bande passante
    • Suppression de paquets
    • Erreurs

Alertes

Google Cloud a mené des activités de normalisation et de validation approfondies pour répondre aux exigences spécifiques de l'environnement de la solution Bare Metal. Si un un événement certifié se situe en dehors de la plage normale, le système de surveillance déclenche une alerte.

Gestion des incidents

Google Cloud et notre fournisseur d'infrastructure partenaire disposent d'une équipe dédiée 24h/24, 7j/7 chargée de la gestion des incidents. Une équipe de pont est également disponible 24h/24, 7j/7 pour effectuer l'analyse initiale de chaque demande d'assistance et prendre les mesures nécessaires pour atténuer le problème. En fonction de la gravité de l'incident, nous déployons les équipes appropriées pour le résoudre.

Cloud Customer Care collabore avec l'équipe SysOps d'ingénierie de Google Cloud. Ils peuvent vous fournir et coordonnez toute action nécessitant votre aide. Au besoin, L'équipe d'ingénierie de Google Cloud collabore avec le fournisseur d'infrastructure ou fournisseurs de matériel pour vous aider à résoudre votre problème.

Processus d'analyse des causes fondamentales

Lorsque les incidents ont un impact important et grave, Google fournit des rapports d'incident décrivant les symptômes, l'impact, l'origine du problème, les mesures correctives la prévention des incidents. Comme pour les analyses post-mortem, nous accordons une attention particulière les mesures que nous prenons pour tirer des leçons du problème et améliorer la fiabilité.

Nous espérons que ce résumé de nos fonctionnalités de surveillance vous aidera dans l'environnement de la solution Bare Metal lors de la migration votre infrastructure et vos applications vers le cloud.