Surveiller dans un environnement de solution Bare Metal

La solution Bare Metal vous permet d'exécuter des charges de travail spécialisées dans des extensions régionales situés à proximité des centres de données Google Cloud. En implémentant une solution Bare Metal vous pouvez réduire les coûts globaux et les risques associés la migration vers le cloud.

Présentation de la surveillance

L'une de nos principales priorités est de proposer pour l'environnement de la solution Bare Metal. Pour cette raison, Google Cloud et ses partenaires effectuent diverses activités de surveillance. La Voici une liste des appareils d'infrastructure dans une solution Bare Metal que nous surveillons:

Infrastructure de calcul

  • Matériel serveur

Infrastructure de stockage

  • Périphériques de stockage
  • Commutateurs SAN

Infrastructure réseau

  • Routeurs
  • Commutateurs
  • Infrastructure d'interconnexion

Google Cloud assure également le suivi de l'environnement du centre de données, y compris la température et l'humidité de la salle de serveurs.

Nous ne surveillons pas les systèmes d'exploitation, l'activité et les charges de travail au niveau des applications, et le trafic réseau vers et depuis les serveurs de la solution Bare Metal. À prévisualiser un utilitaire vous permettant d'utiliser Cloud Operations pour surveiller le système d'exploitation activité, contact Équipe commerciale Google Cloud.

Outils de surveillance

Notre partenaire utilise des solutions logicielles de qualité professionnelle pour surveiller la conformité avec la bibliothèque ITIL (Information Technology Infrastructure Library). Google Cloud et son partenaire utilisent également les services Google Cloud, tels que Pub/Sub, les fonctions Cloud Run et Cloud Monitoring, pour collecter et traiter ces données de surveillance. Nos systèmes internes de gestion des demandes d'assistance et de notification travailler directement avec ces services.

Données de surveillance

Dans les grandes lignes, nos données de surveillance proviennent des sources suivantes:

  • Problèmes SNMP
  • Messages Syslog
  • Messages provenant d’un logiciel de gestion dédié
  • IPMI (Intelligent Platform Management Interface)

Métriques courantes des appareils surveillés:

  • Utilisation du processeur
  • Interface réseau: <ph type="x-smartling-placeholder">
      </ph>
    • Utilisation de la bande passante
    • Suppressions de paquets
    • Erreurs

Alertes

Google Cloud a mené des activités de normalisation et de validation approfondies pour répondre aux exigences spécifiques de l'environnement de la solution Bare Metal. Si un un événement certifié se situe en dehors de la plage normale, le système de surveillance déclenche une alerte.

Gestion des incidents

Google Cloud et son fournisseur d'infrastructure partenaire proposent Équipe 24h/24, 7j/7 responsable de la gestion des incidents. Une équipe de liaison est également à votre disposition. 24h/24, 7j/7 pour effectuer l'analyse initiale de chaque demande d'assistance et prendre le les mesures nécessaires pour atténuer le problème. Selon la gravité de l’incident, nous déployons des équipes appropriées pour résoudre l’incident.

Cloud Customer Care collabore avec l'équipe SysOps d'ingénierie de Google Cloud. Ils peuvent vous fournir et coordonnez toute action nécessitant votre aide. Au besoin, L'équipe d'ingénierie de Google Cloud collabore avec le fournisseur d'infrastructure ou fournisseurs de matériel pour vous aider à résoudre votre problème.

Processus d'analyse des causes fondamentales

Lorsque les incidents ont un impact important et grave, Google fournit des rapports d'incident décrivant les symptômes, l'impact, l'origine du problème, les mesures correctives la prévention des incidents. Comme pour les analyses post-mortem, nous accordons une attention particulière les mesures que nous prenons pour tirer des leçons du problème et améliorer la fiabilité.

Nous espérons que ce résumé de nos fonctionnalités de surveillance vous aidera dans l'environnement de la solution Bare Metal lors de la migration votre infrastructure et vos applications dans le cloud.