Aperçu des alertes

Cette section décrit les fonctionnalités d'alerte disponibles dans l'appliance Google Distributed Cloud (GDC) sous air gap.

Les alertes sont un service d'observabilité qui vous permet de détecter rapidement les problèmes dans GDC afin de les résoudre rapidement. Une règle d'alerte décrit les circonstances dans lesquelles vous souhaitez être averti et comment vous souhaitez recevoir les notifications.

Les règles d'alerte basées sur des métriques suivent les données de surveillance du système collectées et avertissent des personnes spécifiques lorsqu'une ressource remplit une condition prédéfinie. Par exemple, une règle d'alerte qui surveille l'utilisation du processeur d'une machine virtuelle (VM) peut envoyer une notification à une équipe d'astreinte lorsqu'un événement active la règle. Une règle qui surveille un test de disponibilité peut également envoyer une notification aux équipes de développement et d'astreinte.

Pour surveiller les événements récurrents dans vos journaux au fil du temps, utilisez des métriques basées sur les journaux pour créer des règles d'alerte. Les métriques basées sur les journaux génèrent des données numériques à partir des données de journalisation du système. Les métriques basées sur les journaux sont adaptées si vous souhaitez effectuer l'une de ces opérations :

  • Comptez les occurrences d'un message dans vos journaux, par exemple un avertissement ou une erreur. Recevez également une notification lorsque le nombre d'événements dépasse un seuil.
  • Observer les tendances qui se dessinent dans vos données, par exemple les valeurs de latence dans les journaux. Vous recevrez également une notification si les valeurs changent de manière inacceptable.
  • Créez des graphiques affichant les données numériques extraites de vos journaux.

La plate-forme d'observabilité de GDC collecte les alertesentrantes et envoie des notifications aux utilisateurs en fonction des règles de configuration et de workflow pour l'observabilité des données. Dans GDC, les alertes peuvent générer des pages et des tickets pour les erreurs critiques. Les pages nécessitent une attention immédiate de la part d'un opérateur, tandis que les demandes sont moins urgentes.