Monitoring in einer Bare-Metal-Lösungsumgebung

Mit der Bare-Metal-Lösung können Sie spezielle Arbeitslasten in regionalen Erweiterungen ausführen, die sich in der Nähe von Google Cloud-Rechenzentren befinden. Durch die Implementierung einer Bare-Metal-Lösung können Sie Ihre Gesamtkosten senken und die mit der Migration in die Cloud verbundenen Risiken reduzieren.

Monitoring-Übersicht

Eine unserer wichtigsten Prioritäten besteht darin, Verfügbarkeit für die Bare-Metal-Lösungsumgebung. Aus diesem Grund führen Google Cloud und unsere Partner verschiedene Monitoring-Aktivitäten durch. Im Folgenden finden Sie eine Liste der Infrastrukturgeräte in einer Bare-Metal-Lösungsumgebung, die wir überwachen:

Recheninfrastruktur

  • Server hardware

Speicherinfrastruktur

  • Speichergeräte
  • SAN-Switches

Netzwerkinfrastruktur

  • Router
  • Schalter
  • Interconnect-Infrastruktur

Google Cloud überwacht auch die Rechenzentrumsumgebung, einschließlich der Temperatur und Luftfeuchtigkeit im Serverraum.

Wir überwachen keine Betriebssysteme, Aktivitäten und Arbeitslasten auf Anwendungsebene. und Netzwerktraffic zu und von den Servern der Bare-Metal-Lösung. Bis Vorschau eines Dienstprogramms ansehen, mit dem Sie mit Cloud Operations die Betriebssystemebene überwachen können Aktivität, Kontakt Google Cloud-Vertrieb:

Monitoring-Tools

Unser Partner verwendet für das Monitoring kommerzielle Softwarelösungen, die vollständig der Information Technology Infrastructure Library (ITIL) entsprechen. Google Cloud und unser Partner nutzen auch Google Cloud-Dienste wie Pub/Sub, Cloud Run-Funktionen und Cloud Monitoring, um diese Überwachungsdaten zu verarbeiten. Unsere internen Ticket- und Benachrichtigungssysteme direkt mit diesen Diensten zusammenarbeiten.

Monitoring-Daten

Unsere Monitoring-Daten stammen im Wesentlichen aus den folgenden Quellen:

  • SNMP-Traps
  • Syslog-Nachrichten
  • Nachrichten von dedizierter Verwaltungssoftware
  • Intelligent Platform Management Interface (IPMI)

Gängige Messwerte der überwachten Geräte:

  • CPU-Auslastung
  • Netzwerkschnittstelle:
    • Bandbreitenauslastung
    • Verworfene Pakete
    • Fehler

Benachrichtigungen

Google Cloud hat umfangreiche Normalisierungs- und Validierungsaktivitäten durchgeführt für die spezifischen Anforderungen der Bare-Metal-Lösungsumgebung. Wenn ein zertifizierten Ereignis außerhalb des normalen Bereichs liegt, löst eine Benachrichtigung aus.

Vorfallmanagement

Google Cloud und unser Partnerinfrastrukturanbieter haben einen eigenen Rund um die Uhr für die Reaktion auf Vorfälle verantwortliches Team Ein Bridge-Team ist rund um die Uhr erreichbar, um die erste Analyse jedes Supporttickets durchzuführen und die erforderlichen Maßnahmen zur Behebung des Problems zu ergreifen. Je nach Schwere des Vorfalls setzen wir die entsprechenden Teams ein, um ihn zu beheben.

Cloud Customer Care arbeitet mit dem Google Cloud Engineering SysOps-Team zusammen. Sie erhalten auf dem Laufenden halten und Maßnahmen koordinieren, die Ihre Hilfe benötigen. Bei Bedarf setzt sich das Google Cloud-Entwicklerteam mit dem Infrastrukturanbieter oder den Hardwareanbietern in Verbindung, um das Problem zu beheben.

Ursachenanalyse

Bei weitreichenden und schwerwiegenden Vorfällen stellt Google Vorfallberichte bereit die Symptome, Auswirkungen, Ursachen, Maßnahmen und um Vorfälle zu vermeiden. Wie bei Postmortems achten wir besonders auf die Maßnahmen, die wir ergreifen, um aus dem Problem zu lernen und die Zuverlässigkeit zu verbessern.

Wir hoffen, dass diese Zusammenfassung unserer Monitoring-Funktionen Ihnen hilft, auf die Bare-Metal-Lösungsumgebung vertrauen, wenn Sie Ihre Infrastruktur und Anwendungen in die Cloud migrieren.