Ce document explique comment utiliser la console Google Cloud pour créer une règle d'alerte qui surveille le nombre de processus exécutés sur vos machines virtuelles (VM) qui répondent aux conditions que vous spécifiez. Ce type de règle d'alerte est parfois appelé règle d'alerte de santé des processus. Par exemple, vous pouvez compter le nombre de processus démarrés par l'utilisateur racine. Vous pouvez également compter le nombre de processus dont la commande d'appel contenait une chaîne spécifique. Une règle d'alerte peut vous avertir lorsque le nombre de processus est supérieur ou inférieur à un seuil. Pour en savoir plus sur les processus pouvant être surveillés, consultez la section Processus surveillés.
Ce contenu ne concerne pas les règles d'alerte basées sur les journaux. Pour en savoir plus sur les règles d'alerte basées sur les journaux, qui vous avertissent lorsqu'un message particulier s'affiche dans les journaux, consultez la page Surveiller vos journaux.
Avant de commencer
-
Pour obtenir les autorisations nécessaires pour créer et modifier des règles d'alerte à l'aide de la console Google Cloud, demandez à votre administrateur de vous accorder le rôle IAM Éditeur Monitoring (
roles/monitoring.editor
) dans votre projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur les rôles Cloud Monitoring, consultez Contrôler les accès avec Identity and Access Management.
Assurez-vous de bien maîtriser les concepts généraux des règles d'alerte. Pour en savoir plus sur ces sujets, consultez la page Présentation des alertes.
Configurez les canaux de notification que vous souhaitez utiliser pour recevoir des alertes. À des fins de redondance, nous vous recommandons également de créer plusieurs types de canaux de notification. Pour en savoir plus sur ces étapes, consultez la page Créer et gérer des canaux de notification.
Assurez-vous d'avoir installé l'agent Ops sur les VM que vous souhaitez surveiller. Pour en savoir plus, consultez la page Agents Google Cloud Observability.
Créer une règle d'alerte
Pour créer une règle d'alerte qui surveille le nombre de processus exécutés sur une VM à l'aide de l'API Cloud Monitoring, l'expression de filtre doit spécifier un sélecteur de séries temporelles. Pour obtenir un exemple de fichier JSON qui spécifie ce sélecteur, consultez la section Stratégie de santé des processus.
Pour créer une règle d'alerte qui surveille le nombre de processus exécutés sur une VM, procédez comme suit:
-
Dans la console Google Cloud, accédez à la page notificationsAlertes :
Accéder à l'interface des alertes
Si vous utilisez la barre de recherche pour trouver cette page, sélectionnez le résultat dont le sous-titre est Monitoring.
- Sélectionnez Créer une règle.
Sélectionnez ? dans l'en-tête de la section Sélectionner une métrique, puis sélectionnez Mode de filtrage direct dans l'info-bulle.
Saisissez un filtre Monitoring.
Par exemple, pour compter le nombre de processus exécutés sur des instances de VM Compute Engine dont le nom inclut
nginx
, saisissez la commande suivante :select_process_count("monitoring.regex.full_match(\".*nginx.*\")") resource.type="gce_instance"
Pour en savoir plus sur la syntaxe, consultez les ressources suivantes :
- Pour connaître les filtres permettant de compter les processus exécutés sur des machines virtuelles, consultez la section Filtres d'état de processus.
- Pour connaître la syntaxe générale, consultez la page Filtres de surveillance.
Complétez la règle d'alerte. Vous devez configurer le déclencheur de condition, les notifications, la documentation et le nom de la règle, puis cliquer sur Créer une règle.
Pour plus d'informations, consultez la page Créer des règles d'alerte basées sur un seuil de métrique.
Processus surveillés
Les processus qui s'exécutent dans votre système ne peuvent pas tous être surveillés par une condition d'état de processus. Cette condition sélectionne les processus à surveiller à l'aide d'une expression régulière appliquée à la ligne de commande qui a appelé le processus. Lorsque le champ de ligne de commande n'est pas disponible, le processus ne peut pas être surveillé.
Pour déterminer si un processus peut être surveillé par une condition d'état de processus, vous pouvez examiner les processus actifs. Par exemple, sur un système Linux, vous pouvez utiliser la commande ps
:
ps aux | grep nfs
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1598 0.0 0.0 0 0 ? S< Oct25 0:00 [nfsd4]
root 1639 0.0 0.0 0 0 ? S Oct25 2:33 [nfsd]
root 1640 0.0 0.0 0 0 ? S Oct25 2:36 [nfsd]
Lorsqu'une entrée COMMAND
est encapsulée entre crochets, par exemple [nfsd]
, les informations de ligne de commande du processus ne sont pas disponibles. Dans ce cas, vous ne pouvez pas utiliser Cloud Monitoring pour surveiller le processus.