Ce document explique comment utiliser la console Google Cloud pour créer alertes basées sur les métriques d'une règle qui envoie des notifications lorsque les valeurs d'une métrique sont supérieures ou inférieures au seuil pour une fenêtre de nouveau test spécifique. Par exemple, la condition d'une règle d'alerte peut être remplie lorsque l'utilisation du processeur est supérieure à 80 % pendant au moins cinq minutes.
Ce contenu ne concerne pas les règles d'alerte basées sur les journaux. Pour plus d'informations sur les règles d'alerte basées sur les journaux, qui vous informent lorsqu'un s'affiche dans vos journaux, consultez Surveiller vos journaux
Ce document ne décrit pas les éléments suivants:
- Recevoir une notification lorsque les données cessent d'arriver Pour plus d'informations, consultez la section Créer des règles d'alerte en cas d'absence de métrique.
- Recevoir une notification en fonction de la valeur prédite d'une métrique Pour en savoir plus, consultez la section Créer des règles d'alerte basées sur la valeur prévue d'une métrique.
Créer une règle d'alerte à l'aide de l'API Cloud Monitoring Pour plus pour en savoir plus, consultez Créer des règles d'alerte à l'aide de l'API
Créer une règle d'alerte dont la condition inclut un une requête MQL (Monitoring Query Language). Ces règles peuvent utiliser un modèle statique ou dynamique de sortie. Pour en savoir plus, consultez les documents suivants :
Avant de commencer
-
Pour obtenir les autorisations nécessaires pour créer et modifier des règles d'alerte à l'aide de la console Google Cloud, demandez à votre administrateur de vous accorder le Éditeur Monitoring (
roles/monitoring.editor
) sur votre projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur les rôles Cloud Monitoring, consultez Contrôler les accès avec Identity and Access Management.
Assurez-vous de bien connaître les concepts généraux des règles d'alerte. Pour en savoir plus sur ces sujets, consultez la page Présentation des alertes.
Configurez les canaux de notification que vous souhaitez utiliser pour recevoir les notifications. À des fins de redondance, nous vous recommandons de créer plusieurs types de canaux de notification. Pour en savoir plus, consultez Créer et gérer des canaux de notification
Créer une règle d'alerte
Pour créer une règle d'alerte qui compare la valeur de cette métrique à une valeur un seuil minimal, procédez comme suit:
-
Dans la console Google Cloud, accédez à la page notificationsAlertes :
Accéder à l'interface des alertes
Si vous utilisez la barre de recherche pour trouver cette page, sélectionnez le résultat dont le sous-titre est Monitoring.
- Sélectionnez Créer une règle.
Sélectionnez la série temporelle à surveiller :
Cliquez sur Sélectionner une métrique, puis naviguez dans les menus pour sélectionner une le type de ressource et le type de métrique, puis cliquez sur Appliquer.
Le menu Sélectionner une métrique propose des fonctionnalités qui vous aident à identifier les types de métriques disponibles:
- Pour rechercher un type de métrique spécifique, utilisez le
filter_list Barre de filtres.
Par exemple, si vous saisissez
util
, vous limitez le menu aux afficher les entrées contenantutil
. Les entrées s'affichent lorsqu'elles réussissent un test "contient" non sensible à la casse.
- Pour afficher tous les types de métriques, même celles sans données, cliquez sur Métrique non listée dans le menu. Actif. Par défaut, les menus n'afficher que les types de métriques avec des données. Pour en savoir plus, consultez la section
Vous pouvez surveiller n'importe quelle métrique intégrée ou n'importe quelle la métrique.
- Pour rechercher un type de métrique spécifique, utilisez le
filter_list Barre de filtres.
Par exemple, si vous saisissez
Facultatif: Pour surveiller un sous-ensemble de la série temporelle correspondant aux les types de ressources et de métriques sélectionnés à l'étape précédente, cliquez sur Ajouter un filtre. Dans la boîte de dialogue de filtrage, sélectionnez le libellé à filtrer, un comparateur, puis la valeur du filtre. Par exemple, le filtre
zone =~ ^us.*.a$
utilise une expression régulière pour faire correspondre toutes les données de séries temporelles dont le nom de zone commence parus
et se termine par aveca
. Pour en savoir plus, consultez Filtrer la série temporelle sélectionnéeFacultatif : Pour modifier l'alignement des points d'une série temporelle, procédez comme suit : Dans la section Transformer les données, définissez la fenêtre glissante et Champs du fenêtrage glissant.
Si vous surveillez une métrique basée sur les journaux, nous vous recommandons de définir le menu Fenêtre glissante sur au moins 10 minutes.
Ces champs spécifient comment les points enregistrés dans une fenêtre sont combinés. Par exemple, supposons que la fenêtre soit de 15 minutes et que la fonction de fenêtre soit
max
. Le point aligné correspond à la valeur maximale de tous les points au cours des 15 dernières minutes. Pour en savoir plus, consultez Alignement: régularisation au sein de la série.Vous pouvez également surveiller la fréquence à laquelle la valeur d'une métrique change. Utilisez le champ Fenêtrage glissant pour indiquer un pourcentage de variation. Pour en savoir plus, consultez Contrôler une variation.
Facultatif: combinez des séries temporelles si vous souhaitez réduire le nombre de de séries temporelles surveillées par une règle, ou lorsque vous souhaitez uniquement surveiller un ensemble de séries temporelles. Par exemple, au lieu de surveiller de l'utilisation du processeur de chaque instance de VM, vous pouvez calculer la moyenne de l'utilisation du processeur pour toutes les VM d'une zone, puis de surveiller cette moyenne. Par défaut, ne sont pas combinées. Pour obtenir des informations générales, consultez la page Réduction: combinaison de séries temporelles.
Pour combiner toutes les séries temporelles, procédez comme suit:
- Dans la section Sur plusieurs séries temporelles, cliquez sur expand_more Développer.
- Définissez le champ Agrégation de séries temporelles sur une valeur autre que
none
Par exemple, pour afficher la valeur moyenne série temporelle, sélectionnezmean
. - Vérifiez que le champ Grouper les séries temporelles par est vide.
Pour combiner ou regrouper des séries temporelles par valeurs de libellé, procédez comme suit:
- Dans la section Sur plusieurs séries temporelles, cliquez sur expand_more Développer.
- Définissez le champ Agrégation de séries temporelles sur une valeur autre que
none
. - Dans le champ Time series group by (Regrouper par séries temporelles), sélectionnez les étiquettes. à regrouper.
Par exemple, si vous effectuez un regroupement par libellé
zone
, puis que vous définissez le d'agrégation sur une valeur demean
, le graphique affiche une série temporelle pour chaque zone pour laquelle des données sont disponibles. La La série temporelle affichée pour une zone spécifique correspond à la moyenne de toutes les séries temporelles avec cette zone.Cliquez sur Suivant.
Configurez le déclencheur de condition:
Conservez la valeur par défaut du champ Type de condition : Seuil :
Facultatif: Mettez à jour le menu Déclencheur d'alerte, qui présente les valeurs suivantes:
À chaque infraction de série temporelle: paramètre par défaut. Série temporelle indifférente dépassement du seuil pour toute la période de nouveau test la condition est remplie.
Pourcentage de séries temporelles enfreintes: pourcentage de séries temporelles doit dépasser le seuil pour toute la période de nouveau test avant que la condition ne soit remplie. Par exemple, vous pouvez recevoir une notification lorsque 50% des séries temporelles surveillées ne respectent pas le seuil pour toute la période de nouveau test.
Nombre de séries temporelles enfreintes : un nombre spécifique de séries temporelles doit enfreindre le seuil pour l'ensemble de la période de nouvelle analyse avant que la condition ne soit remplie. Par exemple, vous pouvez recevoir une notification lorsque 32 des séries temporelles surveillées dépassent le seuil pour l'ensemble de la période de nouvelle analyse.
Toutes les séries temporelles enfreintes : toutes les séries temporelles doivent enfreindre le seuil pendant toute la période de nouveau test pour que la condition soit remplie.
Pour en savoir plus sur les intervalles pour aligner et mesurer les données des séries temporelles, consultez Périodes d'alignement et périodes de nouveau test.
Indiquez quand la valeur d'une métrique ne respecte pas le seuil à l'aide des champs Position du seuil et Valeur du seuil. Par exemple, si vous définissez ces valeurs sur Au-dessus du seuil et
0.3
, toutes les une mesure supérieure à0.3
dépasse le seuil.Facultatif: Pour sélectionner la durée pendant laquelle les mesures doivent dépasser le seuil avant que Monitoring envoie une notification, développez Options avancées, puis utiliser le menu Retester la fenêtre.
La valeur par défaut est Aucun nouveau test. Avec ce paramètre, une seule la mesure peut entraîner l'envoi d'une notification. Pour en savoir plus et Pour obtenir un exemple, consultez Paramètres de période et de durée d'alignement
Facultatif: Pour spécifier la manière dont Monitoring évalue le lorsque les données cessent d'arriver, développer Options avancées, puis utiliser l'option Données d'évaluation manquantes .
Le menu Évaluation des données manquantes est désactivé lorsque la valeur du paramètre L'option Fenêtre de nouveau test indique Aucun nouveau test.
Console Google Cloud
« Évaluation des données manquantes » champRésumé Détails Données manquantes vides Les incidents ouverts restent ouverts.
Aucun nouvel incident n'est ouvert.Lorsque les conditions sont remplies, la condition est toujours est satisfaite lorsque les données cessent d'arriver. Si un incident est ouvert pour cette condition, il reste ouvert. Lorsqu'un incident est ouvert et qu'aucune donnée n'arrive, le minuteur de fermeture automatique se déclenche après un délai d'au moins 15 minutes. Si le délai expire, l'incident est clôturé.
Pour les conditions qui ne sont pas remplies, la condition ne continue pas d'être remplie lorsque les données cessent d'arriver.
Points de données manquants traités comme des valeurs qui ne respectent pas la condition du règlement Les incidents ouverts restent ouverts.
De nouveaux incidents peuvent être ouverts.Lorsque les conditions sont remplies, la condition est toujours est satisfaite lorsque les données cessent d'arriver. Si un incident est ouvert pour cette condition, il reste ouvert. Lorsqu'un incident est ouvert et qu'aucune donnée n'arrive pour la fermeture automatique plus 24 heures, l’incident est clos.
Lorsque les conditions ne sont pas remplies, le paramètre condition de seuil de métrique pour qu'elle se comporte comme une
metric-absence condition
. Si les données n'arrivent pas dans le délai spécifié par la période de nouvelle analyse, la condition est considérée comme remplie. Pour une règle d'alerte avec une condition, la condition remplie entraîne l'ouverture d'un incident.Points de données manquants traités comme des valeurs n'enfreignant pas la condition du règlement Les incidents ouverts sont fermés.
Les nouveaux incidents ne sont pas ouverts.Pour les conditions remplies, la condition cesse d'être remplie lorsque : les données cessent d'arriver. Si un incident est ouvert pour cette condition, alors l’incident est clos.
Lorsque les conditions ne sont pas remplies, lorsque les données cessent d'arriver.
Cliquez sur Suivant.
Facultatif: Créez une règle d'alerte avec plusieurs conditions.
La plupart des règles surveillent un seul type de métrique. Par exemple, une règle peut et surveiller le nombre d'octets écrits dans une instance de VM. Quand vous voulez pour surveiller plusieurs types de métriques, créez une règle avec plusieurs conditions. Chaque condition surveille un type de métrique. Une fois les conditions créées, vous spécifiez comment elles sont combinées. Pour en savoir plus, consultez Règles avec plusieurs conditions :
Pour créer une règle d'alerte avec plusieurs conditions, procédez comme suit :
- Pour chaque condition supplémentaire, cliquez sur Ajouter une condition d'alerte, puis configurer cette condition.
- Cliquez sur Suivant et configurez le mode de combinaison des conditions.
- Cliquez sur Suivant pour accéder aux notifications et à la documentation. configuration.
Configurez les notifications:
Développez le menu Notifications et nom et sélectionnez votre notification. canaux. À des fins de redondance, nous vous recommandons d'ajouter plusieurs types de canaux de notification. Pour en savoir plus, consultez Gérer les canaux de notification.
Facultatif: Pour recevoir une notification lorsqu'un incident est clôturé, sélectionnez Envoyer une notification lors de la clôture de l'incident Par défaut, si vous créez une règle d'alerte avec la console Google Cloud, il y a envoi d'une notification uniquement à la création d'un incident.
Facultatif: Pour modifier le délai d'attente de Monitoring fermer un incident une fois que les données cessent d'arriver, sélectionnez une option dans Menu Durée de la fermeture automatique de l'incident Par défaut, lorsque les données n'arrivent plus, Monitoring attend sept jours avant de fermer un incident ouvert.
Sélectionnez une option dans le menu Niveau de gravité de la règle. Incidents et les notifications affichent le niveau de gravité.
Facultatif : Pour ajouter des libellés personnalisés à la règle d'alerte, dans la section Libellés utilisateur de la règle, procédez comme suit :
- Cliquez sur Ajouter une étiquette, puis dans le champ Clé, saisissez un nom pour la
libellé. Les noms des étiquettes doivent commencer par une lettre minuscule et peuvent
contenir des lettres minuscules, des chiffres, des traits de soulignement et des tirets.
Par exemple, saisissez
severity
. - Cliquez sur Valeur, puis saisissez une valeur pour votre libellé. Les valeurs d'étiquette
contenir des lettres minuscules, des chiffres, des traits de soulignement et des tirets.
Par exemple, saisissez
critical
.
Découvrez comment utiliser les libellés de stratégie pour gérer plus facilement vos notifications, consultez Annotez les incidents à l'aide de libellés.
- Cliquez sur Ajouter une étiquette, puis dans le champ Clé, saisissez un nom pour la
libellé. Les noms des étiquettes doivent commencer par une lettre minuscule et peuvent
contenir des lettres minuscules, des chiffres, des traits de soulignement et des tirets.
Par exemple, saisissez
Facultatif: Dans la section Documentation, saisissez le contenu de votre choix. inclus dans la notification.
Pour mettre en forme votre documentation, vous pouvez utiliser du texte brut, Markdown et les variables. Vous pouvez également inclure des liens pour aider les utilisateurs à déboguer l'incident, tels que des liens vers des playbooks internes, des tableaux de bord Google Cloud et des pages externes. Par exemple, le modèle de documentation suivant décrit un CPU d'utilisation d'une ressource
gce_instance
et inclut plusieurs variables pour référencer la règle d'alerte et la condition REST ressources. Le modèle de documentation redirige ensuite les lecteurs vers des pages externes pour les aider à déboguer.Lorsque des notifications sont créées, Monitoring remplace les variables de documentation et leurs valeurs. Les valeurs remplacent les variables uniquement dans les notifications. Le volet d'aperçu et les autres emplacements dans la console Google Cloud n'affichent que le format Markdown.
Aperçu
## CPU utilization exceeded ### Summary The ${metric.display_name} of the ${resource.type} ${resource.label.instance_id} in the project ${resource.project} has exceeded 90% for over 15 minutes. ### Additional resource information Condition resource name: ${condition.name} Alerting policy resource name: ${policy.name} ### Troubleshooting and Debug References Repository with debug scripts: example.com Internal troubleshooting guide: example.com ${resource.type} dashboard: example.com
Mettre en forme dans la notification
Pour en savoir plus, consultez Annoter les notifications avec de la documentation définie par l'utilisateur et Utiliser les commandes de canal.
Cliquez sur Nom de l'alerte et saisissez un nom pour la règle d'alerte.
Cliquez sur Créer une règle.
Filtrer la série temporelle sélectionnée
Les filtres permettent de s'assurer que seules les séries temporelles répondant à un ensemble de critères sont surveillées. Lorsque vous appliquez des filtres, vous pouvez réduire le nombre de lignes du graphique, ce qui peut améliorer les performances du graphique. Vous pouvez également réduire quantité de données surveillée en appliquant une agrégation. Les filtres permettent de s'assurer que seules les séries temporelles répondant à un ensemble de critères sont utilisées. Lorsque vous appliquez des filtres, vous avez moins de séries temporelles à évaluer, ce qui peut d'améliorer les performances de l'alerte.
Un filtre est composé d'une étiquette, d'un comparateur et d'une valeur. Par exemple,
pour faire correspondre toutes les séries temporelles dont le libellé zone
commence par "us-central1"
, vous
peut utiliser le filtre zone=~"us-central1.*"
, qui utilise une expression régulière ;
pour effectuer la comparaison.
Lorsque vous filtrez par ID de projet ou par conteneur de ressources,
vous devez utiliser l'opérateur "égal", (=)
. Lorsque vous filtrez par d'autres libellés, vous pouvez utiliser n'importe quel comparateur compatible.
En règle générale, vous pouvez filtrer les étiquettes de métrique et de ressource, et
groupe de ressources.
Lorsque vous indiquez plusieurs critères de filtrage, seules les séries temporelles répondant à tous les critères sont surveillées.
Pour ajouter un filtre, cliquez sur Ajouter un filtre, renseignez les champs de la boîte de dialogue, puis cliquez sur OK. Dans la boîte de dialogue, utilisez le champ Filtrer pour sélectionner critère de filtrage, sélectionnez l'opérateur de comparaison, puis sélectionnez la valeur. Chaque ligne du tableau suivant répertorie un opérateur de comparaison, sa signification et un Exemple:
Opérateur | Signification | Exemple |
---|---|---|
= |
Égalité | resource.labels.zone = "us-central1-a" |
!= |
Inégalité | resource.labels.zone != "us-central1-a" |
=~ |
Égalitté expression_régulière2 | monitoring.regex.full_match("^us.*") |
!=~ |
Inégalité Expression régulière2 | monitoring.regex.full_match("^us.*") |
starts_with |
La valeur commence par | resource.labels.zone = starts_with("us") |
ends_with |
La valeur se termine par | resource.labels.zone = ends_with("b") |
has_substring |
La valeur contient | resource.labels.zone = has_substring("east") |
one_of |
Une | resource.labels.zone = one_of("asia-east1-b", "europe-north1-a") |
!starts_with |
La valeur ne commence pas par | resource.labels.zone != starts_with("us") |
!ends_with |
La valeur ne se termine pas par | resource.labels.zone != ends_with("b") |
!has_substring |
La valeur ne contient pas | resource.labels.zone != has_substring("east") |
!one_of |
La valeur n'est pas l'une des suivantes | resource.labels.zone != one_of("asia-east1-b", "europe-north1-a") |
Résoudre les problèmes
Cette section contient des conseils de dépannage.
Métrique non listée dans le menu des métriques disponibles
Pour surveiller une métrique qui ne figure pas dans le menu Sélectionner une métrique, procédez comme suit :
Pour créer une règle d'alerte qui surveille une métrique Google Cloud, développez le menu Sélectionner une métrique, puis cliquez sur
Actif. Lorsque cette option est désactivée, le menu affiche toutes les métriques pour services Google Cloud, et toutes les métriques avec des données.Configurer une condition pour un type de métrique personnalisée avant cette métrique génère des données, vous devez spécifier le type de métrique à l'aide d'un Filtre de surveillance:
- Sélectionnez ? dans l'en-tête de la section Sélectionner une métrique, puis sélectionnez Mode de filtrage direct dans l'info-bulle.
Saisissez un filtre de surveillance ou un sélecteur de série temporelle. Pour en savoir plus sur la syntaxe, consultez les documents suivants:
Surveiller un taux de variation
Pour surveiller le taux de variation d'une valeur de métrique, définissez le champ Fonction de fenêtre glissante sur Variation en pourcentage. Une fois la condition évaluée, Monitoring calcule le taux de variation de la métrique en pourcentage, puis compare ce pourcentage au seuil de la condition. Ce processus de comparaison comporte deux étapes:
- Si la série temporelle comporte un genre de métrique
DELTA
ouCUMULATIVE
, alors la série temporelle est convertie en une série de genre de métriqueGAUGE
. Pour en savoir plus sur la consultez Genres, types et conversions. - Monitoring calcule le pourcentage de variation en comparant la valeur moyenne de la fenêtre glissante de 10 minutes la plus récente la valeur moyenne de la fenêtre glissante de 10 minutes avant le début de la période d'alignement.
Vous ne pouvez pas modifier la période glissante de 10 minutes utilisée pour les comparaisons dans une règle d'alerte de taux d'évolution. Cependant, vous spécifiez la période d'alignement lorsque vous créez la condition.
Étape suivante
- Pour créer une règle qui compare la valeur d'une série temporelle à une valeur vous devez utiliser MQL. Pour plus d'informations, consultez la page Créer des niveaux de gravité dynamiques à l'aide de MQL.
Les instructions de cette page s'appliquent à toutes les règles d'alerte. Les éléments suivants : documents fournissent des conseils pour des configurations spécifiques: