Présentation des alertes

Les alertes permettent de détecter et de résoudre rapidement les problèmes qui surviennent dans les applications cloud.

Pour créer une règle d'alerte, vous devez décrire pour quelles raisons et comment vous souhaitez être averti. Cette page vous offre un aperçu des règles d'alerte et des concepts qui les sous-tendent.

Pour une présentation plus pratique, suivez les étapes de l'un des guides de démarrage rapide suivants :

En ce qui concerne les règles permettant de surveiller l'utilisation de Stackdriver et d'envoyer une alerte à l'approche du seuil de facturation, consultez la page relative aux alertes sur l'utilisation de Stackdriver.

Fonctionnement des alertes

Vous pouvez créer et gérer des règles d'alerte à l'aide de la console Stackdriver Monitoring, de l'API Stackdriver Monitoring et du SDK Cloud.

Chaque règle spécifie les éléments suivants :

  • Des conditions, qui identifient un état défaillant pour une ressource ou un groupe de ressources.

  • Des notifications facultatives envoyées par e-mail, SMS ou d'autres canaux pour informer l'équipe d'assistance d'une ressource défaillante.

  • De la documentation facultative pouvant être incluse dans certains types de notifications pour aider l'équipe d'assistance à résoudre le problème.

Lorsque des événements déclenchent des conditions de l'une de vos règles d'alerte, Stackdriver Monitoring crée et affiche un incident dans la console Stackdriver Monitoring. Si vous activez les notifications, Stackdriver Monitoring envoie également des notifications à des personnes ou à des services de notification tiers. Les personnes qui reçoivent la notification peuvent en accuser réception, mais l'incident reste ouvert jusqu'à ce que les ressources ne soient plus défaillantes.

Pour en savoir plus sur ces concepts, consultez la section concernant les règles d'alerte en profondeur.

Exemple

Vous déployez une application Web sur une instance de VM Compute Engine qui exécute une pile LAMP. Même si vous n'êtes pas sans savoir que la latence de réponse HTTP peut varier en fonction de l'augmentation ou de la diminution de la demande, vous souhaitez pouvoir réagir si vos utilisateurs rencontrent une latence élevée sur une période prolongée.

Pour recevoir une notification lorsque vos utilisateurs rencontrent une latence élevée, créez la règle d'alerte suivante :

Si la latence de réponse HTTP est supérieure à deux secondes,
et si cette condition dure plus de cinq minutes,
ouvrir un incident et envoyer un e-mail à l'équipe d'assistance.

Votre application Web a plus de succès que prévu et la latence des réponses est supérieure à deux secondes. La règle d'alerte réagit de la manière suivante :

  1. Stackdriver Monitoring ouvre un incident et envoie un e-mail après une latence HTTP supérieure à deux secondes pendant plus de cinq minutes consécutives.

  2. L'équipe d'assistance reçoit l'e-mail, se connecte à la console Stackdriver Monitoring et accuse réception de la notification.

  3. En suivant les instructions de la documentation incluse dans l'e-mail de notification, l'équipe est en mesure de traiter la cause de la latence. En quelques minutes, les réponses HTTP repassent sous la barre des deux secondes.

  4. Dès que Stackdriver Monitoring mesure une latence HTTP en dessous de deux secondes, la condition de la règle n'est plus vérifiée (même si une seule mesure de latence inférieure enfreint l'exigence relative aux cinq minutes consécutives).

    Stackdriver Monitoring clôture l'incident et réinitialise le minuteur de cinq minutes. Si la latence dépasse de nouveau les deux secondes pendant cinq minutes consécutives, la règle ouvre un nouvel incident.

Étape suivante

Tarifs et limites

L'utilisation de règles d'alerte ou de tests de disponibilité est totalement gratuite, mais dans les limites suivantes :

Catégorie Valeur
Tests de disponibilité par espace de travail 100
Règles d'alerte par espace de travail 500
Conditions par règle d'alerte 6
Canaux de notification par règle d'alerte 16
Canaux de notification par espace de travail 4 000
Incidents ouverts simultanément par règle d'alerte 5000
Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…

Stackdriver Monitoring
Besoin d'aide ? Consultez notre page d'assistance.