Surveillance dans un environnement de solution Bare Metal
La solution Bare Metal vous permet d'exécuter des charges de travail spécialisées dans des extensions régionales situées à proximité de Google Cloud centres de données. En implémentant un environnement de solution Bare Metal, vous pouvez réduire vos coûts globaux et les risques associés à la migration vers le cloud.
Présentation de la surveillance
L'une de nos principales priorités est de fournir la disponibilité la plus élevée possible pour l'environnement de solution Bare Metal. C'est pourquoiGoogle Cloud et nos partenaires effectuent diverses activités de surveillance. Vous trouverez ci-dessous la liste des appareils d'infrastructure d'un environnement de solution Bare Metal que nous surveillons:
Infrastructure de calcul
- Matériel du serveur
Infrastructure de stockage
- Périphériques de stockage
- Commutateurs SAN
Infrastructure réseau
- Routeurs
- Commutateurs
- Infrastructure d'interconnexion
Google Cloud suit également l'environnement du centre de données, y compris la température et l'humidité de la salle des serveurs.
Nous ne surveillons pas les systèmes d'exploitation, l'activité et les charges de travail au niveau de l'application, ni le trafic réseau allant et venant des serveurs de la solution Bare Metal. Pour obtenir un aperçu d'un utilitaire qui vous permet d'utiliser Cloud Operations pour surveiller l'activité au niveau de l'OS, contactez le service commercialGoogle Cloud .
Outils de surveillance
Notre partenaire utilise des solutions logicielles de surveillance de qualité commerciale qui respectent pleinement la bibliothèque ITIL (Information Technology Infrastructure Library).Google Cloud et notre partenaire utilise également Google Cloud des services tels que Pub/Sub, les fonctions Cloud Run et Cloud Monitoring pour collecter et traiter ces données de surveillance. Nos systèmes internes de création de demandes et de notification fonctionnent directement avec ces services.
Données de surveillance
De manière générale, nos données de surveillance proviennent des sources suivantes:
- Pièges SNMP
- Messages Syslog
- Messages provenant d'un logiciel de gestion dédié
- IPMI (Intelligent Platform Management Interface)
Métriques courantes des appareils surveillés:
- Utilisation du processeur
- Interface réseau :
- Utilisation de la bande passante
- Suppression de paquets
- Erreurs
Alertes
Google Cloud a mené des activités de normalisation et de validation approfondies pour les exigences spécifiques de l'environnement de la solution Bare Metal. Si un événement certifié sort de la plage normale, le système de surveillance déclenche une alerte.
Gestion des incidents
Google Cloud et notre fournisseur d'infrastructure partenaire disposent d'une équipe dédiée 24h/24, 7j/7 pour gérer les incidents. Une équipe de pont est également disponible 24h/24, 7j/7 pour effectuer l'analyse initiale de chaque demande d'assistance et prendre les mesures nécessaires pour atténuer le problème. En fonction de la gravité de l'incident, nous déployons les équipes appropriées pour le résoudre.
Le service client Cloud collabore avec l' Google Cloud équipe d'ingénieurs SysOps. Ils peuvent vous tenir informé et coordonner les actions qui nécessitent votre aide. Si nécessaire, l'équipe d'ingénieursGoogle Cloud contacte le partenaire du fournisseur d'infrastructure ou les fournisseurs de matériel pour vous aider à résoudre votre problème.
Processus d'analyse des causes fondamentales
Lorsque les incidents ont des conséquences importantes et très étendues, Google fournit des rapports d'incident décrivant les symptômes, l'impact, l'origine, les mesures correctives et les futures actions de prévention. Comme pour les analyses post-mortem, nous accordons une attention particulière aux mesures que nous prenons pour tirer les leçons du problème et améliorer la fiabilité.
Nous espérons que ce résumé de nos fonctionnalités de surveillance vous aidera à vous sentir en confiance dans l'environnement de la solution Bare Metal lorsque vous migrerez votre infrastructure et vos applications vers le cloud.