Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Mithilfe von Benachrichtigungen können Sie sich über den Status und die Leistung Ihrer Air-Gap-Bereitstellungen auf dem Laufenden halten. Sie liefern zeitnahe Benachrichtigungen, wenn bestimmte Bedingungen erfüllt sind, sodass Sie Folgendes tun können:
Probleme proaktiv angehen: Probleme erkennen und darauf reagieren, bevor sie sich auf Nutzer oder Geschäftsabläufe auswirken.
Ausfallzeiten reduzieren: Minimieren Sie Dienstunterbrechungen, indem Sie schnell Korrekturmaßnahmen ergreifen.
Servicelevels aufrechterhalten: Sorgen Sie dafür, dass Ihre Anwendungen die Leistungs- und Verfügbarkeitsziele erreichen.
Betriebliche Statistiken erhalten: Sie können Trends und Muster in Ihrer Umgebung erkennen, um die Ressourcennutzung und Leistung zu optimieren.
Auf dieser Seite erhalten Sie einen Überblick über das Erstellen und Verwalten von Benachrichtigungen in Google Distributed Cloud (GDC) Air-Gap-Umgebungen. Sie erfahren, wie Sie Überwachungsdaten verwenden, um kritische Ereignisse in Ihren Anwendungen und Ihrer Infrastruktur proaktiv zu erkennen und darauf zu reagieren.
Arten von Benachrichtigungsrichtlinien
Messwertbasierte Benachrichtigungsrichtlinien verfolgen Überwachungsdaten und benachrichtigen bestimmte Personen, wenn eine Ressource eine vordefinierte Bedingung erfüllt. Eine Benachrichtigungsrichtlinie, die die CPU-Auslastung einer virtuellen Maschine überwacht, kann beispielsweise eine Benachrichtigung senden, wenn ein Ereignis die Richtlinie aktiviert. Alternativ kann eine Richtlinie, die eine Verfügbarkeitsdiagnose überwacht, Bereitschafts- und Entwicklungsteams benachrichtigen.
Wenn Sie wiederkehrende Ereignisse in Ihren Logs im Zeitverlauf beobachten möchten, können Sie mit logbasierten Messwerten Benachrichtigungsrichtlinien erstellen. Logbasierte Messwerte generieren numerische Daten aus Logging-Daten. Logbasierte Messwerte eignen sich für folgende Zwecke:
Zählen des Vorkommens einer Nachricht in Logs, beispielsweise einer Warnung oder eines Fehlers. Sie werden benachrichtigt, wenn die Anzahl der Ereignisse einen Grenzwert überschreitet.
Beobachten von Trends in Ihren Daten, z. B. von Latenzwerte in Ihren Logs. Sie können sich benachrichtigen lassen, wenn sich die Werte auf inakzeptable Weise ändern.
Erstellen von Diagrammen, um die aus Logs extrahierten numerischen Daten darzustellen.
In GDC können durch Benachrichtigungen Seiten und Tickets für kritische Fehler generiert werden. Seiten erfordern sofortige Maßnahmen von einem Kundenservicemitarbeiter, während Tickets weniger dringend sind.
Schlüsselkomponenten
Der GDC-Benachrichtigungsdienst verwendet die folgenden Komponenten:
Prometheus: Ein Open-Source-Monitoring-System, das häufig zum Erfassen und Speichern von Messwerten verwendet wird. Es bietet eine leistungsstarke Abfragesprache (PromQL) zum Definieren von Benachrichtigungsregeln.
Monitoring-Plattform: Ein verwalteter Monitoring-Dienst, der Messwerte aus verschiedenen Quellen, einschließlich Prometheus, erfasst. Sie bietet erweiterte Funktionen wie Grafana-Dashboards, benutzerdefinierte Messwerte und Benachrichtigungen.
Alertmanager: Eine Komponente, die für den Empfang, die Verarbeitung und das Weiterleiten von Benachrichtigungen zuständig ist. Sie unterstützt das Gruppieren, Stummschalten und Unterdrücken von Benachrichtigungen, um die Anzahl der Benachrichtigungen zu reduzieren und die Effizienz zu steigern.
Benachrichtigungsworkflow
GDC bietet ein Benachrichtigungs-Framework, das in verschiedene Monitoring-Tools und ‑Dienste eingebunden werden kann. Der typische Workflow umfasst die folgenden Phasen:
Datenerhebung: Verwenden Sie Tools wie Prometheus und Fluent Bit, um Messwerte und Logs aus Ihren Anwendungen, Ihrer Infrastruktur und Kubernetes zu erfassen.
Monitoring: Die erfassten Daten in Grafana-Dashboards speichern und visualisieren.
Benachrichtigungsregeln: Definieren Sie Benachrichtigungsregeln basierend auf bestimmten Bedingungen, z. B. wenn die CPU-Auslastung einen Schwellenwert überschreitet oder die Anzahl der Anwendungsfehler eine bestimmte Rate überschreitet.
Alertmanager: Alertmanager empfängt Benachrichtigungen, die durch die definierten Regeln ausgelöst werden, und kümmert sich um das Routing und die Stummschaltung von Benachrichtigungen.
Benachrichtigungen: Sie können Benachrichtigungen über verschiedene Kanäle wie E-Mail, Nachrichten oder Webhooks erhalten.
Best Practices
Beachten Sie beim Einrichten von Benachrichtigungen die folgenden Best Practices:
Klare und umsetzbare Benachrichtigungen definieren: Ihre Benachrichtigungen sollten spezifische Informationen zum Problem enthalten und geeignete Maßnahmen vorschlagen.
Angemessene Schweregrade festlegen: Kategorisieren Sie Benachrichtigungen nach ihrer Auswirkung und Dringlichkeit, um Reaktionsmaßnahmen zu priorisieren.
Benachrichtigungsmüdigkeit vermeiden: Optimieren Sie Ihre Benachrichtigungsregeln, um Fehlalarme und unnötige Benachrichtigungen zu minimieren.
Regelmäßig Tests für Ihre Benachrichtigungen durchführen: Prüfen Sie, ob Ihre Benachrichtigungen richtig ausgelöst werden und ob Benachrichtigungen wie erwartet zugestellt werden.
Benachrichtigungsstrategie dokumentieren: Dokumentieren Sie Ihre Benachrichtigungsregeln, Benachrichtigungskanäle und Eskalierungsverfahren.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[[["\u003cp\u003eAlerts in Google Distributed Cloud (GDC) air-gapped environments provide notifications on the health and performance of deployments, enabling proactive issue resolution and reduced downtime.\u003c/p\u003e\n"],["\u003cp\u003eMetric-based alerting policies track monitoring data, triggering notifications when a resource meets a pre-established condition, while log-based metrics monitor recurring events in logs.\u003c/p\u003e\n"],["\u003cp\u003eThe GDC alerting service integrates Prometheus for metrics collection, a monitoring platform for data visualization, and Alertmanager for alert processing and routing.\u003c/p\u003e\n"],["\u003cp\u003eThe alerting workflow involves data collection, monitoring, defining alert rules, alert processing by Alertmanager, and receiving notifications through various channels.\u003c/p\u003e\n"],["\u003cp\u003eBest practices for setting up alerts include defining clear, actionable alerts, setting appropriate severity levels, minimizing false positives, regularly testing alerts, and documenting the alerting strategy.\u003c/p\u003e\n"]]],[],null,["# Alerting overview\n\nAlerts help you stay informed about the health and performance of your\nair-gapped deployments. They provide timely notifications when specific\nconditions are met, letting you do the following:\n\n- **Proactively address issues**: Detect and respond to problems before they impact users or business operations.\n- **Reduce downtime**: Minimize service disruptions by taking corrective action quickly.\n- **Maintain service levels**: Ensure your applications meet performance and availability targets.\n- **Gain operational insights**: Identify trends and patterns in your environment to optimize resource utilization and performance.\n\nThis page provides an overview of creating and managing alerts in\nGoogle Distributed Cloud (GDC) air-gapped environments. It explains how to use monitoring\ndata to proactively identify and respond to critical events within your\napplications and infrastructure.\n\nAlerting policy types\n---------------------\n\nMetric-based alerting policies track monitoring data and notify specific people\nwhen a resource meets a pre-established condition. For example, an alerting\npolicy that monitors the CPU utilization of a virtual machine might send a\nnotification when an event activates the policy. Alternatively, a policy that\nmonitors an uptime check might notify on-call and development teams.\n\nOn the other hand, to monitor recurring events in your logs over time, use\nlog-based metrics to create alerting policies. Log-based metrics generate\nnumerical data from logging data. Log-based metrics are suitable when you want\nto do any of the following:\n\n- Count the message occurrences in your logs, like a warning or error. Receive a notification when the number of events crosses a threshold.\n- Observe trends in your data, like latency values in your logs. Receive a notification if the values change unacceptably.\n- Create charts to display the numeric data extracted from your logs.\n\nIn GDC, alerts can generate pages and tickets for\ncritical errors. Pages require immediate attention from an operator, while\ntickets are less urgent.\n\nKey components\n--------------\n\nThe GDC alerting service uses the following components:\n\n- **Prometheus**: An open-source monitoring system widely used for collecting and storing metrics. It provides a powerful query language (PromQL) for defining alert rules.\n- **Monitoring platform**: A managed monitoring service that collects metrics from various sources, including Prometheus. It offers advanced features like Grafana dashboards, custom metrics, and alerting.\n- **Alertmanager**: A component responsible for receiving, processing, and routing alerts. It supports grouping, silencing, and inhibiting alerts to reduce noise and improve efficiency.\n\nAlerting workflow\n-----------------\n\nGDC provides an alerting framework that integrates with\nvarious monitoring tools and services. The typical workflow involves the\nfollowing stages:\n\n1. **Data collection**: Use tools like Prometheus and Fluent Bit to collect metrics and logs from your applications, infrastructure, and Kubernetes.\n2. **Monitoring**: Store and visualize the collected data in Grafana dashboards.\n3. **Alerting rules**: Define alert rules based on specific conditions, such as CPU usage exceeding a threshold or application errors exceeding a certain rate.\n4. **Alertmanager**: Alertmanager receives alerts triggered by the defined rules and handles notification routing and silencing.\n5. **Notifications**: Receive alerts through various channels, such as email, messages, or webhooks.\n\nBest practices\n--------------\n\nWhen setting up alerts, consider the following best practices:\n\n- **Define clear and actionable alerts**: Ensure your alerts provide specific information about the issue and suggest appropriate actions.\n- **Set appropriate severity levels**: Categorize alerts based on their impact and urgency to prioritize response efforts.\n- **Avoid alert fatigue**: Fine-tune your alert rules to minimize false positives and unnecessary notifications.\n- **Test your alerts regularly**: Verify that your alerts are triggered correctly and notifications are delivered as expected.\n- **Document your alerting strategy**: Document your alert rules, notification channels, and escalation procedures."]]