Cette page explique comment utiliser les métriques et graphiques d'utilisation du processeur, ainsi que d'autres outils d'introspection, pour enquêter sur une utilisation élevée du processeur dans votre base de données.
Identifier si une tâche système ou utilisateur entraîne une utilisation élevée du processeur
La consoleGoogle Cloud fournit plusieurs outils de surveillance pour Spanner, ce qui vous permet d'afficher l'état des métriques les plus importantes pour votre instance. L'un d'eux est un graphique intitulé Utilisation du processeur – Total. Ce graphique affiche l'utilisation totale du processeur, exprimée en pourcentage des ressources de processeur de l'instance, ventilée par priorité de tâche et type d'opération. Il existe deux types de tâches: les tâches utilisateur, telles que les lectures et les écritures, et les tâches système, qui couvrent les tâches en arrière-plan automatisées telles que le compactage et le remplissage d'index.
La figure 1 montre un exemple de graphique Utilisation du processeur – Total.
Figure 1 : Graphique Utilisation du processeur (total) dans le tableau de bord "Surveillance" de la console Google Cloud .
Imaginons maintenant que vous receviez une alerte de Cloud Monitoring indiquant que l'utilisation du processeur a considérablement augmenté. Vous ouvrez le tableau de bord Monitoring de votre instance dans la console Google Cloud , puis examinez le graphique Utilisation du processeur - Total dans la console Cloud. Comme le montre la Figure 1, vous pouvez constater l'augmentation de l'utilisation du processeur par les tâches utilisateur à priorité élevée. L'étape suivante consiste à déterminer quelle opération utilisateur à priorité élevée entraîne cette augmentation de l'utilisation du processeur.
Vous pouvez visualiser cette métrique et d'autres sur une série temporelle à l'aide des tableaux de bord Insights sur les requêtes. Ces tableaux de bord prédéfinis vous aident à afficher les pics d'utilisation du processeur et à identifier les requêtes inefficaces.
Identifier l'opération utilisateur à l'origine du pic d'utilisation du processeur
Le graphique Utilisation du processeur – Total de la Figure 1 montre que les tâches utilisateur à priorité élevée sont la cause d'une utilisation plus élevée du processeur.
Vous allez ensuite examiner le graphique Utilisation du processeur par type d'opération dans Cloud Console. Ce graphique montre l'utilisation du processeur répartie par opérations à priorité élevée, moyenne et faible initiées par l'utilisateur.
Qu'est-ce qu'une opération initiée par l'utilisateur ?
Une opération initiée par l'utilisateur est une opération lancée via une requête API. Spanner regroupe ces requêtes dans des types d'opérations ou des catégories, et vous pouvez afficher chaque type d'opération sous forme de ligne dans le graphique d'utilisation du processeur par type d'opération. Le tableau suivant décrit les méthodes d'API incluses dans chaque type d'opération.
Opération | Méthodes d'API | Description |
---|---|---|
read_readonly | Read StreamingRead |
Inclut les lectures qui extraient des lignes de la base de données à l'aide de recherches et d'analyses de clés. |
read_readwrite | Read StreamingRead |
Inclut les lectures dans les transactions en lecture-écriture. |
read_withpartitiontoken | Read StreamingRead |
Inclut les opérations de lecture effectuées à l'aide d'un ensemble de jetons de partition. |
executesql_select_readonly | ExecuteSql ExecuteStreamingSql |
Inclut l'exécution de l'instruction SQL Select et les requêtes de flux de modifications. |
executesql_select_readwrite | ExecuteSql ExecuteStreamingSql |
Inclut l'exécution de l'instruction Select dans les transactions en lecture-écriture. |
executesql_select_withpartitiontoken | ExecuteSql ExecuteStreamingSql |
Inclut l'exécution de l'instruction Select effectuée à l'aide d'un ensemble de jetons de partition. |
executesql_dml_readwrite | ExecuteSql ExecuteStreamingSql ExecuteBatchDml |
Inclut l'exécution de l'instruction SQL en LMD. |
executesql_dml_partitioned | ExecuteSql ExecuteStreamingSql ExecuteBatchDml |
Inclut l'exécution de l'instruction SQL en LMD partitionné. |
beginorcommit | BeginTransaction Commit Rollback |
Inclut les transactions de début, de commit et de rollback. |
misc | PartitionQuery PartitionRead GetSession CreateSession |
Inclut PartitionQuery, PartitionRead, Create Database, Create Instance, les opérations liées aux sessions, les opérations de diffusion internes urgentes, etc. |
Voici un exemple de graphique illustrant la métrique d'utilisation du processeur par types d'opérations.
Figure 2. Graphique Utilisation du processeur par type d'opération dans la console Google Cloud .
Vous pouvez limiter l'affichage à une priorité spécifique à l'aide du menu Priorité situé en haut du graphique. Il représente chaque type ou catégorie d'opération sur un graphique linéaire. Les catégories listées sous le graphique permettent d'identifier chaque graphique. Vous pouvez masquer ou afficher chaque ligne du graphique en sélectionnant ou en désélectionnant le filtre de catégorie correspondant.
Vous pouvez également créer ce graphique dans l'explorateur de métriques, comme décrit ci-dessous:
Créer un graphique pour l'utilisation du processeur par type d'opération dans l'explorateur de métriques
- Dans la console Google Cloud , sélectionnez Surveillance ou utilisez le bouton suivant:
- Sélectionnez Explorateur de métriques dans le volet de navigation.
-
Dans le champ Rechercher un type de ressource et une métrique, saisissez la valeur
spanner.googleapis.com/instance/cpu/utilization_by_operation_type
, puis sélectionnez la ligne qui s'affiche en dessous. -
Dans le champ Filtre, saisissez la valeur
instance_id
, puis indiquez l'ID de l'instance à examiner et cliquez sur >Appliquer. -
Dans le champ Grouper par, sélectionnez
category
dans la liste déroulante. Le graphique indique l'utilisation du processeur des tâches utilisateur, regroupées par type d'opération ou par catégorie.
Alors que la métrique Utilisation du processeur par priorité de la section précédente vous a aidé à déterminer si une tâche utilisateur ou système a entraîné une augmentation de l'utilisation des ressources de processeur, la métrique Utilisation du processeur par type d'opération vous permet d'aller plus loin et de déterminer le type d'opération lancée par l'utilisateur à l'origine de cette augmentation de l'utilisation du processeur.
Identifier quelle requête utilisateur contribue à l'augmentation de l'utilisation du processeur
Pour déterminer quelle requête utilisateur spécifique est responsable du pic d'utilisation du processeur dans le graphique du type d'opération executesql_select_readonly présenté à la Figure 2, vous allez utiliser des tables de statistiques d'introspection intégrées afin d'obtenir plus d'informations.
Utilisez le tableau suivant comme guide pour déterminer la table de statistiques à interroger en fonction du type d'opération qui entraîne une utilisation élevée du processeur.
Type d'opération | Requête | Lecture | Transaction |
---|---|---|---|
read_readonly | Non | Oui | Non |
read_readwrite | Non | Oui | Oui |
read_withpartitiontoken | Non | Oui | Non |
executesql_select_readonly | Oui | Non | Non |
executesql_select_withpartitiontoken | Oui | Non | Non |
executesql_select_readwrite | Oui | Non | Oui |
executesql_dml_readwrite | Oui | Non | Oui |
executesql_dml_partitioned | Non | Non | Oui |
beginorcommit | Non | Non | Oui |
Par exemple, si le problème vient de read_withpartitiontoken, procédez au dépannage à l'aide des statistiques de lecture.
Dans ce scénario, l'opération executesql_select_readonly semble être la raison de l'augmentation de l'utilisation du processeur que vous observez. Sur la base du tableau précédent, vous devez ensuite examiner les statistiques de requête pour déterminer quelles requêtes sont coûteuses, exécutées fréquemment ou qui analysent beaucoup de données.
Pour connaître les requêtes ayant entraîné le niveau le plus élevé d'utilisation du processeur au cours de l'heure précédente, vous pouvez exécuter la requête suivante dans la table de statistiques query_stats_top_hour
.
SELECT text,
execution_count AS count,
avg_latency_seconds AS latency,
avg_cpu_seconds AS cpu,
execution_count * avg_cpu_seconds AS total_cpu
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
(SELECT MAX(interval_end)
FROM spanner_sys.query_stats_top_hour)
ORDER BY total_cpu DESC;
Le résultat affiche les requêtes triées en fonction de l'utilisation du processeur. Une fois que vous avez identifié la requête présentant le niveau le plus élevé d'utilisation du processeur, vous pouvez essayer les options suivantes pour l'ajuster.
Examinez le plan d'exécution de requête pour identifier les éventuels processus inefficaces susceptibles d'entraîner une utilisation intensive du processeur.
Examinez votre requête pour vous assurer qu'elle respecte les bonnes pratiques SQL.
Examinez la conception du schéma de la base de données et mettez le schéma à jour afin de permettre l'optimisation des requêtes.
Établissez une valeur de référence pour le nombre de fois où Spanner exécute une requête pendant un intervalle. À l'aide de cette référence, vous pourrez détecter et examiner la cause d'écarts inattendus par rapport au comportement normal.
Si vous ne parvenez pas à trouver une requête impliquant une utilisation intensive du processeur, augmentez la capacité de calcul de l'instance. L'ajout de capacité de calcul fournit davantage de ressources de processeur et permet à Spanner de gérer une charge de travail plus importante. Pour en savoir plus, consultez la section Augmenter la capacité de calcul.
Étape suivante
En savoir plus sur les métriques d'utilisation du processeur
Découvrez d'autres outils d'introspection.
Apprenez-en plus sur la surveillance avec Cloud Monitoring.
Découvrez les bonnes pratiques SQL pour Spanner.
Consultez la liste des métriques de Spanner.