Einbindung in Personalized Service Health

Auch wenn Dienstunterbrechungen unvermeidlich sind, ist eine transparente und frühzeitige Kommunikation unerlässlich, um die Situation zu bewerten, Ihre Stakeholder auf dem Laufenden zu halten und Maßnahmen zu ergreifen, um die Auswirkungen auf Ihr Unternehmen zu minimieren.

Für den Betrieb einer zuverlässigen Cloud-Anwendung sindGoogle Cloud und die Anwendungsentwickler gemeinsam verantwortlich. Bei einer Dienstunterbrechung informiertGoogle Cloud schnell über den Vorfall und stellt eine Folgenabschätzung zur Verfügung. Sie müssen festlegen, wie Sie Benachrichtigungen erhalten, auf auftretende Vorfälle reagieren und die Auswirkungen auf Ihre Anwendung verwalten.

Personalized Service Health kann Ihnen dabei helfen. Sie können es auf verschiedene Arten einbinden, um über neue Vorfälle informiert zu werden, die Auswirkungen auf Ihre Anwendungen zu bewerten und Updates von Google Cloudzu erhalten. In diesem Dokument finden Sie einen Überblick darüber, wie Sie vonGoogle CloudBenachrichtigungen zu Dienstunterbrechungen erhalten, einschließlich Empfehlungen zur Einbindung.

Integrationsort festlegen

Google Cloud bietet die folgenden Produkte, mit denen Sie den Zustand Ihrer Google Cloud Produkte besser nachvollziehen können:

  • Google Cloud-Dienststatus: Bietet einen plattformweiten Überblick über alleGoogle Cloud Produkte an allen Standorten. Sie deckt Vorfälle mit größerem Umfang und höherer Schwere ab und ist in folgenden Produkten verfügbar:
  • Personalized Service Health: Bietet eine personalisierte Übersicht über Google Cloud Produkte, die in Ihren Projekten oder in Ihrer Organisation verwendet werden. Er deckt einen breiteren Bereich von Vorfällen ab als die in Google Cloud Service Health veröffentlichten. Personalized Service Health ist in folgenden Produkten verfügbar:

Wir empfehlen die Einbindung in Personalized Service Health, da Sie so die größte Abdeckung und die meisten Integrationsoptionen erhalten.

Integrationspunkt Anwendungsfall Vorteile Abhängigkeiten
Console-Dashboard (Personalized Service Health) Aktive Unterbrechungen ansehen Individuell auf Ihre Projekte zugeschnitten, standardmäßig verfügbar Identity and Access Management (IAM)
Google Cloud Console
Benachrichtigungen (Personalized Service Health) Proaktive Benachrichtigungen Individuell auf Ihre Projekte zugeschnitten, praktisch und proaktiv IAM
Cloud Logging
Cloud Monitoring
API (Personalized Service Health) In ein anderes System oder Tool einbinden Individuell auf Ihre Projekte oder Ihre Organisation abgestimmt IAM

Interaktionsmethode für Personalized Service Health auswählen

Sie müssen Personalized Service Health im Kontext Ihrer geplanten Betriebsabläufe, Ihres Monitorings und Ihres Modells für die Reaktion auf Vorfälle berücksichtigen. Wenn Sie auswerten, wie Ihre Teams Signale während und im Vorfeld von Vorfällen verwenden, können Sie entscheiden, wie Sie die Funktion „Personal Service Health“ verwenden möchten.

In der folgenden Tabelle wird gezeigt, wie Sie je nach Konfiguration mit der personalisierten Dienstbereitschaft interagieren können.

Beispielszenario in Ihrer Organisation Integration mit Personalized Service Health Beispiele für Tools, die Sie möglicherweise einbinden
Entwickler, die für einige Anwendungen im Bereitschaftsdienst sind Benachrichtigungen zu einzelnen Projekten

Console-Dashboard

Google Cloud Observability, PagerDuty
Zentrale Reaktion auf Vorfälle in einer Organisation API-Integration in ein bestehendes System mit der OrganizationEvents API (v1, v1beta) PagerDuty, benutzerdefinierte Dashboards
Interne Plattform zum Verwalten von Cloud-Ressourcen und -Vorgängen Service Health API
Benachrichtigungen zu einzelnen Projekten
Integration der Service Health API in eine interne Entwicklerplattform
Backstage, Terraform
Viele programmatisch konfigurierte und verwaltete Projekte (z. B. mehr als 1.000) Service Health API
Automatisierte API-basierte Benachrichtigungen
Backstage, Terraform, PagerDuty

Personalized Service Health bei einem Vorfall verwenden

Sobald Sie die Einbindung in Personalized Service Health abgeschlossen haben und Benachrichtigungen erhalten, enthält Personalized Service Health Informationen zu Google CloudStörungen, mit denen Sie deren Auswirkungen besser bewältigen können.

Vorfall erkennen und eingrenzen

In dieser Phase können Sie unter anderem folgende Fragen stellen:

  • Ist das ein echtes Problem?
  • Können Sie die Auswirkungen bestätigen?
  • Was sind die Symptome?
  • Welche Nutzer, Produkte oder Teile des Unternehmens sind betroffen? Für welche Regionen?

Mit Personalized Service Health können Sie nachvollziehen, ob das Problem von Ihrem Projekt oder von Google ausgeht, damit Sie die entsprechende Reaktion auf den Vorfall einleiten können. Dort können Sie Ereignisinformationen abrufen und sich ansehen, um das Ereignis, die betroffenen Produkte und Standorte im Blick zu behalten, die sich auf Ihr Projekt auswirken.

Sie können Folgendes tun:

  1. Prüfen Sie die Benachrichtigung, falls Sie sie eingerichtet haben.
    • Was hat diese Benachrichtigung ausgelöst?
    • Wie fügen sich diese Benachrichtigungen in Ihre anderen potenziell produktspezifischen Benachrichtigungen ein?
  2. Rufen Sie das Dashboard „Dienststatus“ für Ihr Projekt oder Ihre Organisation auf. Sie können sich Ereignisse, betroffene Produkte und Standorte auf einen Blick ansehen und die folgenden Fragen beantworten:
    • Welche Ihrer Projekte sind betroffen?
    • Welche Produkte, von denen Ihr Projekt abhängt, sind betroffen?
    • Betrifft das Ereignis bestimmte Ressourcen an diesen Standorten?
  3. Sehen Sie sich die Ereignisse an und informieren Sie sich über ihren Umfang, ihre Auswirkungen und ihre Relevanz für Ihr Projekt.
  4. Suchen Sie nach einem Ereignis, das mit dem Problem in Verbindung stehen könnte.
  5. Hier finden Sie Schritte zur Bestätigung, Maßnahmen zur Risikobegrenzung (falls verfügbar) und die voraussichtliche Zeit bis zur Behebung des Problems.

Mit Personalized Service Health können Sie den aktuellen Status und die Auswirkungen von Vorfällen prüfen, die sich auf Ihr Projekt oder Ihre Organisation auswirken, damit Sie sie effizient verwalten und darauf reagieren können. So können Sie beispielsweise effektiv priorisieren, indem Sie den Vorfall mit der höchsten Priorität genau identifizieren.

Vorfall abmildern, beheben oder eskalieren

In dieser Phase können Sie unter anderem folgende Fragen stellen:

  • Wie können Sie das Problem umgehen?
  • Können Sie das Problem direkt beheben?
  • Sollten Sie jetzt einen Failover initiieren oder noch länger warten?
  • Wen sollten Sie benachrichtigen, damit das Problem behoben wird?

Mit Personalized Service Health können Sie die Auswirkungen eines Vorfalls auf Ihre Projekte und Ressourcen nachvollziehen, sich über verfügbare Problemumgehungen informieren und Updates zur geschätzten Behebungszeit erhalten.

Fortschritt bei der Behebung des Problems im Blick behalten

In der Ereignisübersicht im Dashboard für den Dienststatus finden Sie wichtige Informationen wie Symptome und Problemumgehungen, die zur Behebung erforderlich sind. Außerdem wird angezeigt, wann sich der Status ändert. Anhand dieser Details können Sie Folgendes tun:

  • Behalten Sie eine aktuelle Zusammenfassung der potenziellen Auswirkungen im Blick, während sich die Situation entwickelt.
  • Sie werden über alle Neuigkeiten und den voraussichtlichen Zeitpunkt der nächsten Mitteilung oder Aktualisierung informiert.
  • Sehen, wann ein Symptom veröffentlicht wird
  • Hier erfahren Sie, wann eine Problemumgehung gefunden wird.
  • Sehen Sie nach, wann der Status in Gelöst geändert wird.

Während Sie den Fortschritt beobachten, haben Sie folgende Möglichkeiten:

  • Prüfen Sie, ob es Behelfslösungen gibt.
  • Implementieren Sie die für Ihr Projekt oder Ihre Organisation geeignete Reaktion auf Vorfälle.
  • Beobachten Sie das Ereignis weiter, bis es behoben ist.

Wann Sie den Support kontaktieren sollten

Google ist sich der Ereignisse bewusst, die im Service Health-Dashboard angezeigt werden. Wenn Sie wissen möchten, was Google in Bezug auf ein Ereignis unternimmt, wählen Sie es aus, um die Details zu sehen.

Wenn ein Problem in keinem der Ereignisse im Dashboard aufgeführt ist, wenden Sie sich an den Support.

Personalized Service Health mit anderen Quellen von Informationen zu Vorfällen verwenden

Unabhängig von der Unternehmensstruktur sollten Sie Personalized Service Health als zusätzliches Signal verwenden, wenn Sie die Auswirkungen von Vorfällen bewerten. Achten Sie darauf, dass Sie mehrere Quellen mit Informationen zu Vorfällen prüfen können, damit Sie die nächsten Schritte auf der Grundlage von Daten und Nachweisen festlegen können.

Gründe für die Verwendung mehrerer Quellen für Informationen zu Vorfällen:

  • Ein Google Cloud Produkt ist möglicherweise an einem Standort von einem Vorfall betroffen, Ihre Projekte sind aber möglicherweise nicht betroffen, da sie sich an einem anderen Standort befinden.
  • Wenn Ihr Bereitstellungssystem zwei vollständige Replikate in separaten Zonen hat und ein kritisches Google Cloud Produkt in einer Zone ausfällt, werden Sie in der Funktion „Personalisierte Dienstgesundheit“ darüber informiert. Ihre Nutzer sind jedoch möglicherweise nicht betroffen und Sie müssen möglicherweise nicht sofort Maßnahmen ergreifen.
  • Wenn Ihr Projekt von vielen Google Cloud Produkten an einem Standort abhängt, ist in Personalized Service Health Folgendes nicht bekannt:
    • Wenn für Ihr Projekt alle Produkte funktionieren müssen.
    • Ob Ihr Projekt auch dann funktioniert, wenn ein Produkt ausfällt.
    • Wenn Ihr gesamter Antrag betroffen ist, wenn eines oder mehrere der Produkte fehlschlagen.
  • Auch Personalized Service Health selbst kann beeinträchtigt sein oder ausfallen. Sie können den Status prüfen, um dies zu bestätigen.

Sie müssen die Signale von Personalized Service Health entsprechend Ihrer Konfiguration interpretieren.