Assurer la surveillance avec Cloud Monitoring

Ce document explique comment utiliser la console Cloud Monitoring pour surveiller vos instances Cloud Spanner.

La console Cloud Monitoring offre plusieurs outils de surveillance pour Cloud Spanner :

Si vous préférez surveiller Cloud Spanner de manière automatisée, utilisez les bibliothèques clientes Cloud pour Cloud Monitoring afin d'extraire les métriques.

Utiliser le tableau de bord organisé de Cloud Monitoring

Cloud Monitoring vous fournit un tableau de bord organisé récapitulant les informations essentielles sur vos instances Cloud Spanner, y compris :

  • Incidents : liste des alertes de surveillance créées par l'utilisateur (ouvertes, actives ou résolues)
  • Événements : liste des journaux d'audit de Cloud Spanner (si la journalisation est activée et que des journaux sont disponibles)
  • Instances: résumé général de vos instances Cloud Spanner, y compris la capacité de calcul, le nombre de bases de données et l'état des instances
  • Graphiques agrégés d'utilisation du débit et du stockage

Pour afficher le tableau de bord de Cloud Spanner, procédez comme suit :

  1. Dans Google Cloud Console, sélectionnez Monitoring ou utilisez le bouton suivant :

    Accéder à Monitoring

  2. Si Ressources s'affiche dans le volet de navigation, sélectionnez Ressources, puis Cloud Spanner. Sinon, sélectionnez Tableaux de bord, puis le tableau de bord intitulé Cloud Spanner.

Afficher les détails de l'instance et de la base de données

Lorsque vous ouvrez le tableau de bord organisé pour Cloud Spanner, celui-ci affiche des données cumulées pour toutes vos instances. Vous pouvez afficher plus de détails sur une instance spécifique en cliquant sur son nom sous Instances.

Le tableau de bord affiche des informations relatives à cette instance, telles que ses métadonnées, les bases de données qu'elle contient et les graphiques de diverses métriques ventilées par région.

À partir de la page "Tableau de bord" d'une instance, vous pouvez également accéder aux graphiques associés à une base de données spécifique hébergée dans cette instance :

  1. Sur la droite, au-dessus des graphiques représentant les métriques de l'instance, cliquez sur Métriques de bases de données.

  2. Dans la liste déroulante Sélectionner une répartition, sélectionnez la base de données que vous souhaitez examiner.

    La console Monitoring affiche les graphiques relatifs à la base de données sélectionnée.

Créer des graphiques personnalisés pour les métriques Cloud Spanner

Cloud Monitoring peut vous servir à créer des graphiques personnalisés pour les métriques Cloud Spanner. L'explorateur de métriques permet de créer des graphiques ad hoc temporaires ou des graphiques qui s'affichent dans les tableaux de bord personnalisés.

Cloud Monitoring vous permet surtout de créer un graphique personnalisé indiquant si deux métriques ou plus sont corrélées entre elles. Par exemple, vous pouvez vérifier la corrélation entre l'utilisation du processeur et la latence dans une instance Cloud Spanner, ce qui peut indiquer que votre instance a besoin de Une capacité de calcul plus importante ou le fait que certaines de vos requêtes génèrent une utilisation intensive du processeur

Pour faire vos premiers pas avec cet exemple, procédez comme suit :

  1. Dans Google Cloud Console, sélectionnez Monitoring ou utilisez le bouton suivant :

    Accéder à Monitoring

  2. Si l'explorateur de métriques s'affiche dans le volet de navigation, sélectionnez-le. Sinon, sélectionnez Ressources, puis Explorateur de métriques.

  3. Cliquez sur l'onglet Afficher les options, puis cochez la case Échelle logarithmique sur l'axe y. Cette option vous permet de comparer plusieurs métriques lorsque l'une d'entre elles présente des valeurs beaucoup plus élevées que les autres.

  4. Dans la liste déroulante située au-dessus du panneau de droite, sélectionnez Ligne.

  5. Cliquez sur l'onglet Métriques. Vous pouvez maintenant ajouter des métriques au graphique.

Pour ajouter des métriques de latence au graphique, procédez comme suit :

  1. Dans le champ Rechercher un type de ressource et une métrique, saisissez la valeur spanner.googleapis.com/api/request_latencies, puis cliquez sur la ligne qui s'affiche en dessous.
  2. Dans le champ Filtre, saisissez la valeur instance_id, puis indiquez l'ID de l'instance à examiner et cliquez sur Appliquer.
  3. Dans la liste déroulante Agrégateur, cliquez sur max.
  4. Facultatif : modifiez le centile de latence :

    1. Cliquez sur Afficher les options avancées.
    2. Cliquez sur la liste déroulante Aligneur, puis sur le centile de latence à afficher.

      Dans la plupart des cas, vous devez examiner la latence au 50e centile pour connaître le temps de latence habituel ou la latence au 99e centile pour connaître la latence correspondant aux 1 % de requêtes les plus lentes.

Pour ajouter des métriques d'utilisation du processeur au graphique, procédez comme suit :

  1. Cliquez sur Ajouter une métrique ().
  2. Dans le champ Rechercher un type de ressource et une métrique, saisissez la valeur spanner.googleapis.com/instance/cpu/utilization, puis cliquez sur la ligne qui s'affiche en dessous.
  3. Dans le champ Filtre, saisissez la valeur instance_id, puis indiquez l'ID de l'instance à examiner et cliquez sur Appliquer.
  4. Dans la liste déroulante Agrégateur, cliquez sur max.

Vous disposez désormais d'un graphique indiquant les métriques d'utilisation et de latence du processeur pour une instance Cloud Spanner. Si les deux métriques sont simultanément plus élevées que prévu, vous pouvez prendre des mesures supplémentaires pour corriger le problème.

Pour en savoir plus sur la création de graphiques personnalisés, consultez la documentation sur Cloud Monitoring.

Créer des alertes portant sur des métriques Cloud Spanner

Lorsque vous créez une instance Cloud Spanner, vous devez choisir la capacité de calcul de l'instance. Lorsque la charge de travail de l'instance évolue, Cloud Spanner n'ajuste pas automatiquement la capacité de calcul de l'instance. Par conséquent, vous devez configurer plusieurs alertes pour vous assurer que l'instance respecte les limites maximales d'utilisation du processeur recommandées et la limite de stockage recommandée. (Installation de Python groupée).

Les exemples suivants montrent comment configurer des règles d'alerte pour certaines métriques Cloud Spanner. Pour obtenir la liste complète des métriques disponibles, consultez la page Liste des métriques Cloud Spanner.

Utilisation du processeur, priorité élevée

Pour créer une règle d'alerte qui se déclenche lorsque l'utilisation du processeur par les tâches à priorité élevée pour Cloud Spanner dépasse le seuil recommandé, utilisez les paramètres suivants :

Champ du
volet Cible

Valeur
Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Group By locationPour les instances multirégionales :
Laissez le champ vide pour les instances régionales.
Aggregator sum
Period 10 m
Aligner mean
* La sélection de cette ressource et de ce type de métrique équivaut à saisir la valeur suivante dans le volet Rechercher un type de ressource et une métrique : spanner.googleapis.com/instance/cpu/utilization_by_priority.
Volet Configuration
Champ

Valeur
Condition triggers if Any time series violates
Condition is above
Threshold 45% pour les instances multirégionales ;
65% pour les instances régionales.
For 10 minutes

Utilisation du processeur, moyenne glissante de 24 heures

Pour créer une règle d'alerte qui se déclenche lorsque la moyenne glissante sur 24 heures associée à l'utilisation du processeur pour Cloud Spanner dépasse le seuil recommandé, utilisez les paramètres suivants :

Champ du
volet Cible

Valeur
Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Period 10 m
Aligner mean
* La sélection de cette ressource et de ce type de métrique équivaut à saisir la valeur suivante dans le volet Rechercher un type de ressource et une métrique : spanner.googleapis.com/instance/cpu/smoothed_utilization.
Volet Configuration
Champ

Valeur
Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Stockage

Pour créer une règle d'alerte qui se déclenche lorsque l'espace de stockage de votre instance Cloud Spanner dépasse le seuil recommandé, utilisez les paramètres suivants :

Champ du
volet Cible

Valeur
Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Period 10 m
Aligner max
* La sélection de cette ressource et de ce type de métrique équivaut à saisir la valeur suivante dans le volet Rechercher un type de ressource et une métrique : spanner.googleapis.com/instance/storage/used_bytes.
Volet Configuration
Champ

Valeur
Condition triggers if Any time series violates
Condition is above
Threshold Définissez le seuil sur 75 % de la capacité de stockage maximale par nœud, multipliée par le nombre de nœuds. Pour connaître les limites actuelles des nœuds, consultez la page Quotas et limites de Cloud Spanner.

Pour une limite de 2 To par nœud, le seuil recommandé est le nombre d'octets dans 1,5 To :

1649267441664 multiplié par le nombre de nœuds de votre instance.
For 10 minutes

Étape suivante