Cette page a été traduite par l'API Cloud Translation.

Métriques d'utilisation des ressources de parc

Cette page présente plus en détail les métriques d'utilisation des ressources de la flotte et de l'équipe. Elle explique comment ces métriques sont calculées et fournit des conseils pour les utiliser afin d'optimiser l'utilisation des ressources.

Vous pouvez consulter ces métriques dans les tableaux de bord suivants :

Ces métriques décrivent l'efficacité avec laquelle vos clusters utilisent les ressources physiques disponibles que vous payez ou les ressources que vous allouez sur du matériel sur site. Vous pouvez utiliser ces informations pour comprendre l'efficacité de l'utilisation des ressources à grande échelle, au niveau d'un parc ou d'une équipe. Cela peut vous aider à optimiser la taille du cluster et l'allocation des ressources dans les clusters et les espaces de noms, ou à optimiser la manière dont les équipes chargées des applications demandent et réservent des ressources.

Utiliser les métriques d'utilisation des ressources

Les conseils suivants peuvent vous aider à identifier et à résoudre les problèmes liés à la console à l'aide des métriques :

Si l'utilisation totale du processeur/de la mémoire/du disque de votre parc indique une utilisation inattendue ou faible au cours des sept derniers jours, consultez toujours le graphique Utilisation du processeur/de la mémoire/du disque par parc correspondant pour déterminer si l'utilisation inattendue est constante ou causée par des pics d'utilisation.
Si Utilisation principale du processeur/de la mémoire/du disque par cluster indique que certains clusters se comportent différemment du reste, envisagez d'examiner ces clusters plus en détail. Envisagez de redimensionner les clusters si possible.
Si Utilisation principale du processeur/de la mémoire/du disque par espace de noms affiche un pic inattendu au cours des sept derniers jours, vérifiez si une charge de travail spécifique est à l'origine de ce pic. Une solution possible consiste à redistribuer les charges de travail entre les ressources.
La section Utilisation du processeur/de la mémoire/du disque par parc vous permet d'observer le ratio entre les ressources utilisées et demandées. Une différence majeure entre les deux peut signifier que les équipes en charge des applications demandent et réservent trop de ressources.

Comprendre les métriques d'utilisation des ressources

Les métriques suivantes sont fournies dans les tableaux de bord "Vue d'ensemble" des portées GKE, de parc et d'équipe. Elles sont calculées à l'aide des informations de Cloud Monitoring sur les clusters de votre parc.

Vous pouvez afficher les métriques au niveau du parc dans les tableaux de bord "Vue d'ensemble de GKE et du parc". Les métriques au niveau de l'équipe sont disponibles dans les tableaux de bord "Présentation de GKE" et "Présentation de l'équipe".

Métriques concernant les processeurs

Utilisation totale du processeur :
- Pour les métriques au niveau du parc, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées dans tous les clusters enregistrés dans un parc.
  - Pouvant être alloué : quantité de ressources de processeur allouées à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/cpu/allocatable_cores.
  - Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/cpu/core_usage_time.
- Pour le tableau de bord Surveillance de l'équipe, qui correspond à la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources demandées et les ressources utilisées sur tous les espaces de noms associés à un niveau d'accès d'équipe.
  - Demandé: quantité de ressources processeur demandée par tous les conteneurs sur tous les espaces de noms associés à un niveau d'accès d'équipe. Calculée à partir de la métrique container/cpu/request_cores.
  - Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs sur tous les espaces de noms associés au niveau d'accès de l'équipe. Calculée à partir de la métrique container/cpu/core_usage_time.
Utilisation du processeur par parc/équipe :
- Au niveau du parc, la relation entre les ressources utilisées, demandées et allouées.
  - Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/cpu/core_usage_time.
  - Demandé: quantité de ressources de processeur demandée par tous les conteneurs sur tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/cpu/request_cores.
  - Pouvant être alloué : quantité de ressources de processeur allouées à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/cpu/allocatable_cores.
- Au niveau de l'équipe, la relation entre la limite de ressources, et les ressources utilisées et demandées.
  - Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs sur tous les espaces de noms associés au niveau d'accès de l'équipe. Calculée à partir de la métrique container/cpu/core_usage_time.
  - Demandé: quantité de ressources processeur demandée par tous les conteneurs sur tous les espaces de noms associés à un niveau d'accès d'équipe. Calculée à partir de la métrique container/cpu/request_cores.
  - Limite : quantité maximale de ressources de processeur disponible pour tous les conteneurs sur tous les espaces de noms associés à un niveau d'accès d'équipe. Calculée à partir de la métrique container/cpu/limit_cores.
Utilisation principale du processeur par cluster: liste des clusters triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées pour un cluster spécifique.
- Pouvant être alloué : quantité de ressources de processeur allouées à tous les nœuds d'un cluster. Calculée à partir de la métrique node/cpu/allocatable_cores.
- Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs d'un cluster. Calculée à partir de la métrique container/cpu/core_usage_time.
Utilisation principale du processeur par espace de noms: liste des espaces de noms triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources utilisées et demandées pour un moment particulier.
- Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/cpu/core_usage_time.
- Demandé: quantité de ressources processeur demandées par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/cpu/request_cores.

Métriques relatives à la mémoire

Utilisation totale de la mémoire:
- Pour les métriques au niveau du parc, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées dans tous les clusters appartenant à un parc.
  - Pouvant être alloué : quantité de mémoire allouée à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/memory/allocatable_byte.
  - Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/memory/used_bytes.
- Pour les métriques au niveau de l'équipe, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond à un ratio entre les ressources demandées et les ressources utilisées sur tous les espaces de noms appartenant à un champ d'application d'équipe.
  - Demandé: quantité de mémoire demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/request_bytes.
  - Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/used_bytes.
Utilisation de la mémoire par parc/équipe :
- Au niveau du parc, la relation entre les ressources utilisées, demandées et allouées.
  - Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/memory/used_bytes.
  - Demandé : quantité de mémoire demandée par tous les conteneurs sur tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/memory/request_bytes.
  - Pouvant être alloué : quantité de mémoire allouée à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/memory/allocatable_byte.
- Au niveau de l'équipe, la relation entre la limite de ressources, et les ressources utilisées et demandées.
  - Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/used_bytes.
  - Demandé: quantité de mémoire demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/request_bytes.
  - Limite : quantité maximale de mémoire disponible pour tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/limit_bytes.
Utilisation principale de la mémoire par cluster: liste des clusters triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées pour un cluster particulier.
- Pouvant être allouées : quantité de mémoire allouée à tous les nœuds d'un cluster. Calculée à partir de la métrique node/memory/allocatable_byte.
- Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs d'un cluster. Calculée à partir de la métrique container/memory/used_bytes.
Utilisation principale de la mémoire par espace de noms: liste des espaces de noms triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources utilisées et demandées pour un moment particulier.
- Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/memory/used_bytes.
- Demandé: quantité de mémoire demandée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/memory/request_bytes.

Métriques concernant le disque

Utilisation totale du disque:
- Pour les métriques au niveau du parc, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées dans tous les clusters appartenant à un parc.
  - Pouvant être alloué: quantité d'espace de stockage éphémère local allouée à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/ephemeral_storage/allocatable_bytes.
  - Utilisé : quantité de stockage éphémère local utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
- Pour les métriques au niveau de l'équipe, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond à un ratio entre les ressources demandées et les ressources utilisées sur tous les espaces de noms appartenant à un champ d'application d'équipe.
  - Demandé : quantité de stockage éphémère local demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.
  - Utilisé: quantité d'espace de stockage éphémère local utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
Utilisation du disque par parc/équipe :
- Au niveau du parc, la relation entre les ressources utilisées, demandées et allouées.
  - Utilisé : quantité de stockage éphémère local utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
  - Demandé: quantité de stockage éphémère local demandée par tous les conteneurs sur tous les clusters appartenant à un parc. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.
  - Pouvant être alloué: quantité d'espace de stockage éphémère local allouée à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/ephemeral_storage/allocatable_bytes.
- Au niveau de l'équipe, la relation entre la limite de ressources, et les ressources utilisées et demandées.
  - Utilisé: quantité d'espace de stockage éphémère local utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
  - Demandé : quantité de stockage éphémère local demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.
  - Limite: quantité maximale d'espace de stockage éphémère local disponible pour tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/limit_bytes.
Utilisation principale du disque par cluster: liste des clusters triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées pour un cluster spécifique.
- Pouvant être alloué: quantité d'espace de stockage éphémère local allouée à tous les nœuds d'un cluster. Calculée à partir de la métrique node/ephemeral_storage/allocatable_bytes.
- Utilisé: quantité d'espace de stockage éphémère local utilisée par tous les conteneurs d'un cluster. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
Utilisation principale du disque par espace de noms: liste des espaces de noms triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources utilisées et demandées pour un moment particulier.
- Utilisé: quantité d'espace de stockage éphémère local utilisée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
- Demandé : quantité de stockage éphémère local demandée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.

Distribution des erreurs par espace de noms (au niveau de l'équipe uniquement)

Liste des espaces de noms triée en fonction du nombre le plus élevé de journaux d'erreurs pour une période donnée. Les journaux sont collectés à partir de Cloud Logging.

Distribution du nombre de redémarrages par espace de noms (au niveau de l'équipe uniquement)

Liste des espaces de noms triée par le plus grand nombre de redémarrages de conteneurs pour une période donnée. Calculée à partir de la métrique container/restart_count.

Dépannage

Échec du chargement des métriques pour les nouveaux clusters

Si vous avez créé des clusters, selon la période que vous sélectionnez, vous verrez peut-être No Data dans le tableau de bord Surveillance ou des métriques. Par exemple, si vous avez créé un cluster au cours de la dernière heure et que vous sélectionnez une période de 1 heure ou 6 heures, le tableau de bord peut renvoyer des métriques pour vos charges de travail. Toutefois, si vous sélectionnez une période d'un jour ou plus, vous verrez peut-être No data s'afficher dans le tableau de bord.

En effet, Cloud Monitoring collecte les données à des périodes (intervalles) différentes pour différentes fenêtres temporelles. Pour les périodes de 1 heure et de 6 heures, les données sont collectées par périodes d'une minute. Par conséquent, si votre cluster existe depuis quelques minutes, vous verrez des métriques pour ces périodes.

Pour les périodes de 1 jour et 1 semaine, Cloud Monitoring collecte les données par périodes d'une heure. Si votre cluster existe depuis moins d'une heure, il est possible que vous ne voyiez aucune donnée pour ces périodes.

Si cette erreur se produit, vérifiez le tableau de bord après avoir attendu un peu plus longtemps depuis la création du cluster.