Surveiller les instances avec Cloud Monitoring

Ce document explique comment surveiller vos instances Spanner à l'aide de la console Cloud Monitoring.

La console Cloud Monitoring fournit plusieurs outils de surveillance pour Spanner:

Si vous préférez surveiller Spanner de manière automatisée, utilisez les bibliothèques clientes Cloud pour Cloud Monitoring afin de récupérer les métriques.

Utiliser le tableau de bord organisé par Cloud Monitoring

Cloud Monitoring fournit un tableau de bord organisé qui résume les informations clés sur vos instances Spanner, y compris:

  • Incidents : liste des alertes de surveillance créées par l'utilisateur (ouvertes, actives ou résolues)
  • Événements: liste des journaux d'audit Spanner (si la fonctionnalité est activée et qu'elle est disponible)
  • Instances: résumé général de vos instances Spanner, y compris la capacité de calcul, le nombre de bases de données et l'état de santé des instances.
  • Graphiques agrégés d'utilisation du débit et du stockage

Pour afficher le tableau de bord Spanner, procédez comme suit:

  1. Dans Google Cloud Console, sélectionnez Monitoring ou utilisez le bouton suivant :

    Accéder à Monitoring

  2. Si Ressources s'affiche dans le volet de navigation, sélectionnez Ressources, puis Cloud Spanner. Sinon, sélectionnez Tableaux de bord, puis le tableau de bord intitulé Cloud Spanner.

Afficher les détails de l'instance et de la base de données

Lorsque vous ouvrez le tableau de bord organisé pour Spanner, il affiche des données agrégées pour toutes vos instances. Vous pouvez afficher plus de détails sur une instance spécifique en cliquant sur son nom sous Instances.

Le tableau de bord affiche des informations relatives à cette instance, telles que ses métadonnées, les bases de données qu'elle contient et les graphiques de diverses métriques ventilées par région.

À partir de la page "Tableau de bord" d'une instance, vous pouvez également accéder aux graphiques associés à une base de données spécifique hébergée dans cette instance :

  1. Sur la droite, au-dessus des graphiques représentant les métriques de l'instance, cliquez sur Métriques de bases de données.

  2. Dans la liste déroulante Sélectionner une répartition, sélectionnez la base de données que vous souhaitez examiner.

    La console Cloud Monitoring affiche les graphiques de la base de données.

Créer des graphiques personnalisés pour les métriques Spanner

Vous pouvez utiliser Cloud Monitoring pour créer des graphiques personnalisés pour les métriques Spanner. L'explorateur de métriques permet de créer des graphiques ad hoc temporaires ou des graphiques qui s'affichent dans les tableaux de bord personnalisés.

Plus spécifiquement, Cloud Monitoring vous permet de créer un graphique personnalisé qui indique si plusieurs métriques sont corrélées les unes avec les autres. Par exemple, vous pouvez rechercher une corrélation entre l'utilisation du processeur et la latence dans une instance Spanner, ce qui peut indiquer que votre instance a besoin d'une capacité de calcul supérieure ou que certaines de vos requêtes entraînent une utilisation élevée du processeur.

Pour faire vos premiers pas avec cet exemple, procédez comme suit :

  1. Dans Google Cloud Console, sélectionnez Monitoring ou utilisez le bouton suivant :

    Accéder à Monitoring

  2. Si l'explorateur de métriques s'affiche dans le volet de navigation, sélectionnez-le. Sinon, sélectionnez Ressources, puis Explorateur de métriques.

  3. Cliquez sur l'onglet Afficher les options, puis cochez la case Échelle logarithmique sur l'axe y. Cette option vous permet de comparer plusieurs métriques lorsque l'une d'entre elles présente des valeurs beaucoup plus élevées que les autres.

  4. Dans la liste déroulante située au-dessus du panneau de droite, sélectionnez Ligne.

  5. Cliquez sur l'onglet Métriques. Vous pouvez maintenant ajouter des métriques au graphique.

Pour ajouter des métriques de latence au graphique, procédez comme suit :

  1. Dans le champ Rechercher un type de ressource et une métrique, saisissez la valeur spanner.googleapis.com/api/request_latencies, puis cliquez sur la ligne qui s'affiche en dessous.
  2. Dans le champ Filtre, saisissez la valeur instance_id, puis indiquez l'ID de l'instance à examiner et cliquez sur Appliquer.
  3. Dans la liste déroulante Agrégateur, cliquez sur max.
  4. Facultatif : modifiez le centile de latence :

    1. Cliquez sur Afficher les options avancées.
    2. Cliquez sur la liste déroulante Aligneur, puis sur le centile de latence à afficher.

      Dans la plupart des cas, vous devez examiner la latence au 50e centile pour connaître le temps de latence habituel ou la latence au 99e centile pour connaître la latence correspondant aux 1 % de requêtes les plus lentes.

Pour ajouter des métriques d'utilisation du processeur au graphique, procédez comme suit :

  1. Cliquez sur Ajouter une métrique ().
  2. Dans le champ Rechercher un type de ressource et une métrique, saisissez la valeur spanner.googleapis.com/instance/cpu/utilization, puis cliquez sur la ligne qui s'affiche en dessous.
  3. Dans le champ Filtre, saisissez la valeur instance_id, puis indiquez l'ID de l'instance à examiner et cliquez sur Appliquer.
  4. Dans la liste déroulante Agrégateur, cliquez sur max.

Vous disposez maintenant d'un graphique indiquant les métriques d'utilisation et de latence du processeur pour une instance Spanner. Si les deux métriques sont simultanément plus élevées que prévu, vous pouvez prendre des mesures supplémentaires pour corriger le problème.

Pour en savoir plus sur la création de graphiques personnalisés, consultez la documentation sur Cloud Monitoring.

Créer des alertes pour les métriques Spanner

Lorsque vous créez une instance Spanner, vous choisissez sa capacité de calcul. Lorsque la charge de travail de l'instance évolue, Spanner n'ajuste pas automatiquement la capacité de calcul de l'instance. Ainsi, vous devez configurer plusieurs alertes pour vous assurer que l'instance respecte les valeurs maximales recommandées pour l'utilisation du processeur et la limite recommandée pour le volume de stockage.

Les exemples suivants montrent comment configurer des règles d'alerte pour certaines métriques Spanner. Pour obtenir la liste complète des métriques disponibles, consultez la liste des métriques pour Spanner.

Utilisation du processeur, priorité élevée

Pour créer une règle d'alerte qui se déclenche lorsque l'utilisation du processeur à priorité élevée pour Spanner dépasse le seuil recommandé, utilisez les paramètres suivants.

ChampNouvelle condition

Valeur
Ressource et métrique Dans le menu Ressources, sélectionnez Instance Cloud Spanner.
Dans le menu Catégories de métriques, sélectionnez Instance.
Dans le menu Métriques, sélectionnez Utilisation du processeur par priorité.

(Le type de métrique est spanner.googleapis.com/instance/cpu/utilization_by_priority.)
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Dans toutes les séries temporelles
Regrouper les séries temporelles par
location pour les instances multirégionales ;
laissez le champ vide pour les instances régionales.
Dans toutes les séries temporelles
Agrégation de séries temporelles
sum
Fenêtre glissante 10 m
Fenêtrage glissant mean
Champ Configurer le déclencheur d'alerte

Valeur
Type de condition Threshold
Déclencheur d'alerte Any time series violates
Position du seuil Above threshold
Valeur du seuil 45% pour les instances multirégionales ;
65% pour les instances régionales.
Fenêtre du nouveau test 10 minutes

Utilisation du processeur, moyenne glissante de 24 heures

Pour créer une règle d'alerte qui se déclenche lorsque la moyenne glissante sur 24 heures de l'utilisation du processeur pour Spanner dépasse le seuil recommandé, utilisez les paramètres suivants.

ChampNouvelle condition

Valeur
Ressource et métrique Dans le menu Ressources, sélectionnez Instance Cloud Spanner.
Dans le menu Catégories de métriques, sélectionnez Instance.
Dans le menu Métriques, sélectionnez Utilisation du processeur lissée.

(Le type de métrique est spanner.googleapis.com/instance/cpu/smoothed_utilization.)
Filter instance_id = YOUR_INSTANCE_ID
Dans toutes les séries temporelles
Agrégation de séries temporelles
sum
Fenêtre glissante 10 m
Fenêtrage glissant mean
Champ Configurer le déclencheur d'alerte

Valeur
Type de condition Threshold
Déclencheur d'alerte Any time series violates
Position du seuil Above threshold
Seuil 90%
Fenêtre du nouveau test 10 minutes

Stockage

Pour créer une règle d'alerte qui se déclenche lorsque l'espace de stockage de votre instance Spanner dépasse le seuil recommandé, utilisez les paramètres suivants.

ChampNouvelle condition

Valeur
Ressource et métrique Dans le menu Ressources, sélectionnez Instance Cloud Spanner.
Dans le menu Catégories de métriques, sélectionnez Instance.
Dans le menu Métriques, sélectionnez Espace de stockage utilisé.

(Le type de métrique est spanner.googleapis.com/instance/storage/utilization.)
Filter instance_id = YOUR_INSTANCE_ID
Dans toutes les séries temporelles
Agrégation de séries temporelles
sum
Fenêtre glissante 10 m
Fenêtrage glissant max
Champ Configurer le déclencheur d'alerte

Valeur
Type de condition Threshold
Condition triggers if (déclenchement de la condition) Any time series violates
Position du seuil Above threshold
Valeur du seuil Définissez le seuil sur 75 % de la capacité de stockage maximale par nœud, multipliée par le nombre de nœuds. Pour connaître les limites actuelles du nombre de nœuds, consultez la page Quotas et limites de Spanner.
Fenêtre du nouveau test 10 minutes

Étapes suivantes