Métriques d'utilisation des ressources de parc

Cette page présente plus en détail les métriques d'utilisation des ressources de parc et d'équipe en expliquant comment ces métriques sont calculées et en fournissant des conseils sur leur utilisation pour optimiser l'utilisation des ressources.

Vous pouvez afficher ces métriques dans les tableaux de bord suivants:

Ces métriques décrivent l'efficacité avec laquelle vos clusters utilisent les ressources physiquement disponibles que vous payez ou les ressources que vous allouez sur du matériel sur site. Vous pouvez utiliser ces informations pour comprendre l'efficacité de l'utilisation des ressources à grande échelle, au niveau du parc ou de l'équipe. Cela peut vous aider à optimiser la taille des clusters et l'allocation des ressources sur les clusters et les espaces de noms, ou à optimiser la manière dont les équipes chargées des applications demandent et réservent des ressources.

Utiliser les métriques d'utilisation des ressources

Les conseils suivants peuvent vous aider à identifier et à résoudre les problèmes liés à la console à l'aide des métriques :

  • Si l'utilisation totale du processeur/de la mémoire/du disque de votre parc indique une utilisation inattendue ou faible au cours des sept derniers jours, consultez toujours le graphique Utilisation du processeur/de la mémoire/du disque par parc correspondant pour déterminer si l'utilisation inattendue est constante ou causée par des pics d'utilisation.
  • Si Utilisation principale du processeur/de la mémoire/du disque par cluster indique que certains clusters se comportent différemment du reste, envisagez d'examiner ces clusters plus en détail. Envisagez de redimensionner les clusters si possible.
  • Si l'utilisation principale du processeur/de la mémoire/du disque par espace de noms affiche un pic inattendu au cours des sept derniers jours, envisagez de vérifier si une charge de travail spécifique est à l'origine de ce pic. Une solution possible consisterait à redistribuer les charges de travail entre les ressources.
  • L'utilisation du processeur/de la mémoire/du disque par parc vous permet d'observer le ratio entre les ressources utilisées et demandées. Une différence majeure entre les deux peut signifier que les équipes en charge des applications demandent et réservent trop de ressources.

Comprendre les métriques d'utilisation des ressources

Les métriques suivantes sont fournies dans les tableaux de bord de présentation du champ d'application de GKE Enterprise, du parc et de l'équipe, calculées à l'aide des informations de Cloud Monitoring sur vos clusters de parc.

Vous pouvez afficher les métriques au niveau du parc dans les tableaux de bord de présentation du parc et de GKE Enterprise. Les métriques au niveau de l'équipe sont disponibles dans les tableaux de bord de présentation de l'équipe et de GKE Enterprise.

Métriques concernant les processeurs

  • Utilisation totale du processeur :
    • Pour les métriques au niveau du parc, la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées dans tous les clusters enregistrés dans un parc.
      • Pouvant être alloué: quantité de ressources de processeur allouées à tous les nœuds de l'ensemble des clusters enregistrés dans un parc. Calculée à partir de la métrique node/cpu/allocatable_cores.
      • Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/cpu/core_usage_time.
    • Pour le tableau de bord Surveillance de l'équipe, qui correspond à la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources demandées et les ressources utilisées sur tous les espaces de noms associés à un niveau d'accès d'équipe.
      • Demandé: quantité de ressources processeur demandée par tous les conteneurs sur tous les espaces de noms associés à un niveau d'accès d'équipe. Calculée à partir de la métrique container/cpu/request_cores.
      • Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs sur tous les espaces de noms associés au niveau d'accès de l'équipe. Calculée à partir de la métrique container/cpu/core_usage_time.
  • Utilisation du processeur par parc/équipe :
    • Au niveau du parc, relation entre les ressources utilisées, demandées et allouées.
      • Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/cpu/core_usage_time.
      • Demandé: quantité de ressources de processeur demandée par tous les conteneurs sur tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/cpu/request_cores.
      • Pouvant être alloué: quantité de ressources de processeur allouées à tous les nœuds de l'ensemble des clusters enregistrés dans un parc. Calculée à partir de la métrique node/cpu/allocatable_cores.
    • Au niveau de l'équipe, relation entre la limite de ressources et les ressources utilisées et demandées.
      • Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs sur tous les espaces de noms associés au niveau d'accès de l'équipe. Calculée à partir de la métrique container/cpu/core_usage_time.
      • Demandé: quantité de ressources processeur demandée par tous les conteneurs sur tous les espaces de noms associés à un niveau d'accès d'équipe. Calculée à partir de la métrique container/cpu/request_cores.
      • Limite: quantité maximale de ressources de processeur disponible pour tous les conteneurs sur tous les espaces de noms associés à un niveau d'accès d'équipe. Calculée à partir de la métrique container/cpu/limit_cores.
  • Utilisation principale du processeur par cluster: liste des clusters triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées pour un cluster spécifique.
    • Pouvant être alloué : quantité de ressources de processeur allouées à tous les nœuds d'un cluster. Calculée à partir de la métrique node/cpu/allocatable_cores.
    • Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs d'un cluster. Calculée à partir de la métrique container/cpu/core_usage_time.
  • Utilisation principale du processeur par espace de noms: liste des espaces de noms triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources utilisées et demandées pour un moment particulier.
    • Utilisé: quantité de ressources de processeur utilisée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/cpu/core_usage_time.
    • Demandé: quantité de ressources processeur demandées par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/cpu/request_cores.

Métriques relatives à la mémoire

  • Utilisation totale de la mémoire:
    • Pour les métriques au niveau du parc, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées dans tous les clusters appartenant à un parc.
      • Pouvant être alloué: quantité de mémoire allouée à tous les nœuds de l'ensemble des clusters enregistrés dans un parc. Calculée à partir de la métrique node/memory/allocatable_byte.
      • Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/memory/used_bytes.
    • Pour les métriques au niveau de l'équipe, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond à un ratio entre les ressources demandées et les ressources utilisées sur tous les espaces de noms appartenant à un champ d'application d'équipe.
      • Demandé: quantité de mémoire demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/request_bytes.
      • Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/used_bytes.
  • Utilisation de la mémoire par parc/équipe :
    • Au niveau du parc, relation entre les ressources utilisées, demandées et allouées.
      • Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/memory/used_bytes.
      • Demandé: quantité de mémoire demandée par tous les conteneurs sur tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/memory/request_bytes.
      • Pouvant être alloué: quantité de mémoire allouée à tous les nœuds de l'ensemble des clusters enregistrés dans un parc. Calculée à partir de la métrique node/memory/allocatable_byte.
    • Au niveau de l'équipe, relation entre la limite de ressources et les ressources utilisées et demandées.
      • Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/used_bytes.
      • Demandé: quantité de mémoire demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/request_bytes.
      • Limite: quantité maximale de mémoire disponible pour tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/memory/limit_bytes.
  • Utilisation principale de la mémoire par cluster: liste des clusters triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées pour un cluster particulier.
    • Pouvant être allouées : quantité de mémoire allouée à tous les nœuds d'un cluster. Calculée à partir de la métrique node/memory/allocatable_byte.
    • Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs d'un cluster. Calculée à partir de la métrique container/memory/used_bytes.
  • Utilisation principale de la mémoire par espace de noms: liste des espaces de noms triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources utilisées et demandées pour un moment particulier.
    • Utilisé: quantité de mémoire non récupérable utilisée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/memory/used_bytes.
    • Demandé: quantité de mémoire demandée par tous les conteneurs d'un espace de noms. Calculée à partir de la métrique container/memory/request_bytes.

Métriques concernant le disque

  • Utilisation totale du disque:
    • Pour les métriques au niveau du parc, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées dans tous les clusters appartenant à un parc.
      • Pouvant être alloué: quantité d'espace de stockage éphémère local allouée à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/ephemeral_storage/allocatable_bytes.
      • Utilisé: quantité de stockage éphémère local utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
    • Pour les métriques au niveau de l'équipe, il s'agit de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond à un ratio entre les ressources demandées et les ressources utilisées sur tous les espaces de noms appartenant à un champ d'application d'équipe.
      • Demandé: quantité de stockage éphémère local demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.
      • Utilisé: quantité d'espace de stockage éphémère local utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
  • Utilisation du disque par parc/équipe :
    • Au niveau du parc, relation entre les ressources utilisées, demandées et allouées.
      • Utilisé: quantité de stockage éphémère local utilisée par tous les conteneurs de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
      • Demandé: quantité de stockage éphémère local demandée par tous les conteneurs sur tous les clusters appartenant à un parc. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.
      • Pouvant être alloué: quantité d'espace de stockage éphémère local allouée à tous les nœuds de tous les clusters enregistrés dans un parc. Calculée à partir de la métrique node/ephemeral_storage/allocatable_bytes.
    • Au niveau de l'équipe, relation entre la limite de ressources et les ressources utilisées et demandées.
      • Utilisé: quantité d'espace de stockage éphémère local utilisée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/used_bytes.
      • Demandé: quantité de stockage éphémère local demandée par tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/request_bytes.
      • Limite: quantité maximale d'espace de stockage éphémère local disponible pour tous les conteneurs sur tous les espaces de noms associés à un champ d'application. Calculée à partir de la métrique container/ephemeral_storage/limit_bytes.
  • Utilisation principale du disque par cluster: liste des clusters triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources pouvant être allouées et celles utilisées pour un cluster spécifique.
  • Utilisation principale du disque par espace de noms: liste des espaces de noms triée en fonction de la moyenne de tous les moments précis d'une période donnée, où un moment précis correspond au ratio entre les ressources utilisées et demandées pour un moment particulier.

Répartition des erreurs par espace de noms (au niveau de l'équipe uniquement)

Liste d'espaces de noms triée en fonction du nombre le plus élevé de journaux d'erreurs pour une période donnée. Les journaux sont collectés à partir de Cloud Logging.

Distribution du nombre de redémarrages par espace de noms (au niveau de l'équipe uniquement)

Liste d'espaces de noms triée en fonction du nombre le plus élevé de redémarrages de conteneurs pour une période donnée. Calculée à partir de la métrique container/restart_count.

Dépannage

Échec du chargement des métriques pour les nouveaux clusters

Si vous avez créé des clusters, selon la période sélectionnée, No Data peut s'afficher dans le tableau de bord Monitoring ou des métriques. Par exemple, si vous avez créé un cluster au cours de la dernière heure et que vous sélectionnez une période de 1 heure ou 6 heures, le tableau de bord peut renvoyer des éléments des métriques pour vos charges de travail. Toutefois, si vous sélectionnez une période de 1 jour ou plus, No data peut s'afficher dans le tableau de bord.

En effet, Cloud Monitoring collecte les données à différentes périodes (intervalles) pour différentes périodes. Pour les fenêtres temporelles de 1 heure et de 6 heures, les données sont collectées par périodes d'une minute. Ainsi, si votre cluster existe depuis quelques minutes, les métriques pour ces fenêtres temporelles s'affichent.

Pour les périodes de un jour et d'une semaine, Cloud Monitoring collecte les données par périodes d'une heure. Si votre cluster existe depuis moins d'une heure, il est possible qu'aucune donnée ne s'affiche pour ces périodes.

Si vous rencontrez cette erreur, consultez le tableau de bord une fois qu'un certain temps s'est écoulé depuis la création du cluster.