Cette page a été traduite par l'API Cloud Translation.

Présentation des métriques définies par l'utilisateur

Les métriques définies par l'utilisateur sont toutes les métriques qui ne sont pas définies par Google Cloud. Il s'agit de métriques que vous pouvez définir et de métriques qui qu'une application tierce définit. Les métriques définies par l'utilisateur vous permettent de capturer des données spécifiques à une application ou des données système côté client. Les métriques intégrées collectées par Cloud Monitoring peuvent vous donner des informations sur la latence du backend ou l'utilisation du disque, mais elles ne peuvent pas vous indiquer, par exemple, le nombre de routines d'arrière-plan générées par votre application.

Vous pouvez également créer des métriques basées sur le contenu des entrées de journal. Les métriques basées sur les journaux sont une classe définie par l'utilisateur, mais vous devez créer depuis Cloud Logging. Pour en savoir plus sur les métriques basées sur les journaux, consultez la présentation des métriques basées sur les journaux.

Les métriques définies par l'utilisateur sont parfois appelées "métriques personnalisées" des métriques propres à l'application. Ces métriques vous permettent, à vous ou à un tiers, application, définir et collecter des informations que les métriques intégrées à Cloud Monitoring ne peuvent pas obtenir. Vous pouvez capturer ces métriques à l'aide d'une API fournie par une bibliothèque pour qu'elle instrumente votre code, puis envoyer les métriques à une application backend telle que Cloud Monitoring.

Vous pouvez créer des métriques définies par l'utilisateur, à l'exception des métriques basées sur les journaux, en utilisant directement l'API Cloud Monitoring. Toutefois, nous vous recommandons d'utiliser OpenTelemetry. Pour savoir comment créer des métriques définies par l'utilisateur, consultez les documents suivants :

Collecter des métriques et des traces OTLP explique comment utiliser l'agent Ops et le récepteur OTLP (OpenTelemetry Protocol) de l'agent pour collecter des métriques et des traces à partir d'applications instrumentées avec OpenTelemetry et exécutées sur Compute Engine.
Google Cloud Managed Service pour Prometheus explique comment collecter Prometheus des applications exécutées sur Google Kubernetes Engine et Kubernetes.
Collecter des métriques Prometheus explique comment utiliser l'agent Ops pour collecter des métriques Prometheus à partir d'applications exécutées sur Compute Engine.
Créer des métriques définies par l'utilisateur avec l'API explique comment créer des métriques à l'aide de l'API Cloud Monitoring et comment ajouter des données de métriques à ces métriques. Ce document explique comment utiliser l'API Monitoring avec des exemples utilisant l'explorateur d'API, les langages de programmation C#, Go, Java, Node.js, PHP, Python et Ruby.
Créez des métriques personnalisées Cloud Run montre comment utiliser Collecteur OpenTelemetry en tant qu'agent side-car dans les déploiements Cloud Run

En ce qui concerne Cloud Monitoring, vous pouvez utiliser des métriques définies par l'utilisateur comme les métriques intégrées. Vous pouvez les représenter sous forme de graphique, définir des alertes et les surveiller. Pour en savoir plus sur la lecture des données de métriques, consultez les documents suivants:

La section List metric and resource types (Liste des types de métriques et de ressources) explique comment lister et examiner vos types de métriques définis par l'utilisateur et intégrés. Par exemple : vous pouvez utiliser les informations contenues dans ce document pour lister des descripteurs de métrique dans votre projet.
Récupérer des données de séries temporelles explique comment récupérer des données de séries temporelles à partir de métriques à l'aide de l'API Monitoring. Par exemple, ce document explique comment utiliser l'API pour obtenir l'utilisation du processeur pour les instances de machine virtuelle (VM) de votre projet Google Cloud.

La console Google Cloud fournit une page dédiée qui vous permet de consulter votre utilisation définies par l'utilisateur. Pour en savoir plus sur le contenu de cette page, consultez Afficher et gérer l'utilisation des métriques

Descripteurs de métriques pour les métriques définies par l'utilisateur

Chaque type de métrique doit comporter un descripteur de métrique qui définit l'organisation des données de métrique. Le descripteur de la métrique définit aussi les étiquettes pour la métrique et son nom. Par exemple, Les listes de métriques affichent les descripteurs de métriques pour tous les éléments intégrés types de métriques.

Cloud Monitoring peut créer le descripteur de la métrique à votre place à l'aide de la commande de données de métrique que vous écrivez, ou vous pouvez créer explicitement la métrique et écrire les données de métriques. Dans les deux cas, vous devez décider comment vous souhaitez organiser vos données de métriques.

Exemple de conception

Supposons que vous ayez un programme qui s'exécute sur une seule machine, et que ce programme appelle les programmes auxiliaires A et B. Vous souhaitez comptabiliser la fréquence d'appel des programmes A et B. Vous voulez également savoir quand Le programme A est appelé plus de 10 fois par minute, tandis que le programme B est plus de cinq fois par minute. Enfin, supposons que vous avez un seul projet Google Cloud, et si vous prévoyez d'écrire les données sur la ressource surveillée global.

Cet exemple décrit quelques conceptions différentes que vous pouvez utiliser pour vos métriques définies par l'utilisateur :

Vous utilisez deux métriques: Metric-type-A comptabilise les appels au programme A et Metric-type-B comptabilisent les appels au programme B. Dans ce cas, Metric-type-A contient une série temporelle et Metric-type-B contient une série temporelle.

Avec ce mode de données, vous pouvez créer une règle d'alerte unique avec deux conditions ou deux règles d'alerte chacune avec une condition. Une règle d'alerte peut accepter plusieurs conditions, mais elle possède une configuration unique pour les canaux de notification.

Ce modèle peut être approprié lorsque vous n'êtes pas intéressé par des similitudes entre les données des activités surveillées. Dans cet exemple, les activités correspondent au taux d'appels aux programmes A et B.
Vous utilisez une seule métrique et un libellé pour stocker un identifiant de programme. Par exemple, le libellé peut stocker la valeur A ou B. Monitoring crée une série temporelle pour chaque combinaison unique de libellés. Par conséquent, il existe une série temporelle dont la valeur de libellé est A et une autre dont la valeur de libellé est B.

Comme avec le modèle précédent, vous pouvez créer une ou deux règles d'alerte. Cependant, les conditions de la règle d'alerte sont plus complexes. Une condition qui génère une lorsque le taux d'appels pour le programme A dépasse un seuil Utilisez un filtre qui n'inclut que les points de données dont la valeur de libellé est A.

L'un des avantages de ce modèle est qu'il facilite le calcul des ratios. Par exemple, vous pouvez déterminer la somme totale due aux appels à A.
Vous utilisez une seule métrique pour comptabiliser le nombre d'appels, mais vous n'utilisez pas de libellé pour enregistrer le programme ayant été appelé. Dans ce modèle, il existe une seule série temporelle qui combine les données des deux programmes. Cependant, vous ne pouvez pas créer une règle d'alerte qui répond à vos objectifs, car les données de deux programmes ne peuvent pas être séparées.

Les deux premières conceptions vous permettent de répondre à vos exigences en matière d’analyse de données ; Toutefois, pas la dernière conception.

Pour en savoir plus, consultez Créez une métrique définie par l'utilisateur.

Noms des métriques définies par l'utilisateur

Lorsque vous créez une métrique définie par l'utilisateur, vous définissez un identifiant de chaîne qui représente le type de métrique. Cette chaîne doit être unique parmi les métriques définies par l'utilisateur de votre projet Google Cloud. Elle doit utiliser un préfixe qui marque la métrique comme étant une métrique définie par l'utilisateur. Pour Monitoring, les préfixes autorisés sont les suivants : custom.googleapis.com/, workload.googleapis.com/ external.googleapis.com/user et external.googleapis.com/prometheus. Le préfixe est suivi d'un nom qui décrit les éléments que vous collectez. Pour en savoir plus sur la méthode recommandée pour nommer une métrique, consultez la section Conventions d'attribution de noms aux métriques. Voici des exemples des deux genres d'identifiants employés pour les types de métriques :

    custom.googleapis.com/cpu_utilization
    custom.googleapis.com/instance/cpu/utilization

Dans l'exemple précédent, le préfixe custom.googleapis.com indique que les deux sont des métriques définies par l'utilisateur. Les deux exemples concernent des métriques qui mesurent l'utilisation du processeur. Toutefois, ils utilisent des modèles organisationnels différents. Si vous prévoyez d'utiliser un grand nombre de métriques définies par l'utilisateur, nous vous recommandons d'utiliser une structure d'attribution de noms hiérarchique comme celle utilisée dans le deuxième exemple.

Tous les types de métriques possèdent des identifiants uniques globaux appelés noms de ressources. La structure d'un nom de ressource pour un type de métrique est la suivante :

projects/PROJECT_ID/metricDescriptors/METRIC_TYPE

où METRIC_TYPE est l'identifiant de chaîne du type de métrique. Si les exemples de métriques précédents sont créés dans le projet my-project-id, leurs ressources pour ces métriques sont les suivantes:

    projects/my-project-id/metricDescriptors/custom.googleapis.com/cpu_utilization
    projects/my-project-id/metricDescriptors/custom.googleapis.com/instance/cpu/utilization

Nom ou type ? Dans le descripteur de métrique, le champ name enregistre le nom de ressource du type de métrique et le champ type enregistre la chaîne METRIC_TYPE.

Types de ressources surveillées pour les métriques définies par l'utilisateur

Lorsque vous écrivez vos données dans une série temporelle, vous devez indiquer leur origine. Pour spécifier la source des données, vous choisissez un un type de ressource surveillée représente la provenance de vos données, puis utilisez-le pour décrire une origine spécifique. La ressource surveillée ne fait pas partie du type de métrique. La série temporelle dans lequel vous écrivez des données inclut une référence au type de métrique référence à la ressource surveillée. Le type de métrique décrit les données la ressource surveillée décrit l'origine des données.

Examinez la ressource surveillée avant de créer votre descripteur de métrique. Le type de ressource surveillée que vous utilisez a une incidence sur les libellés que vous devez inclure dans le descripteur de métrique. Par exemple, la ressource VM Compute Engine contient des libellés pour l'ID de projet, l'ID d'instance et la zone de l'instance. Par conséquent, si vous à écrire votre métrique sur une ressource de VM Compute Engine, les étiquettes de ressource incluent l'ID d'instance, vous n'avez pas besoin d'étiquette pour l'ID d'instance dans le descripteur de la métrique.

Chacun des points de données de votre métrique doit être associé à un objet de type "ressource surveillée". Les points des différents objets de type "ressource surveillée" sont stockés dans des séries temporelles.

Vous devez utiliser l'un des types de ressources surveillées suivants avec les métriques définies par l'utilisateur:

aws_ec2_instance : instance Amazon EC2.
dataflow_job : tâche Dataflow.
gae_instance : instance App Engine.
gce_instance : instance Compute Engine.
generic_node : nœud de calcul spécifié par l'utilisateur.
generic_task: Tâche définie par l'utilisateur.
gke_container: une instance de conteneur GKE.
global: Utilisez cette ressource lorsqu'aucun autre type de ressource n'est adapté. Dans la plupart des cas d'utilisation, generic_node ou generic_task sont de meilleurs choix que global.
k8s_cluster : cluster Kubernetes.
k8s_container : conteneur Kubernetes.
k8s_node : nœud Kubernetes.
k8s_pod : pod Kubernetes.

Une pratique courante consiste à utiliser les objets de type "ressource surveillée" représentant les ressources physiques sur lesquelles le code de votre application est exécuté. Cette approche présente plusieurs avantages :

Vous obtenez de meilleures performances par rapport à l'utilisation d'un seul type de ressource.
Vous évitez les données hors service causées par plusieurs processus écrivant dans la même série temporelle.
Vous pouvez regrouper vos données de métriques définies par l'utilisateur avec d'autres données de métriques issues de la les mêmes ressources.

`global` et ressources génériques

Les types de ressources generic_task et generic_node sont utiles lorsqu'aucun des types de ressources plus spécifiques n'est approprié. Le type generic_task sert à définir des ressources de type "tâche", telles que des applications. Le type generic_node sert à définir des ressources de type "nœud", telles que des machines virtuelles. Les deux types generic_* ont plusieurs libellés communs dont vous pouvez vous servir pour définir des objets de ressource uniques. Cela facilite leur utilisation dans les filtres de métriques pour les agrégations et les réductions.

En revanche, le type de ressource global ne comporte que le libellé project_id. Lorsque vous disposez de plusieurs sources de métriques dans un projet, l'utilisation du le même objet ressource global peut entraîner les collisions et les écrasements de vos données de métriques.

Méthodes d'API compatibles avec les métriques définies par l'utilisateur

Le tableau suivant indique les méthodes de l'API Monitoring compatibles avec les métriques définies par l'utilisateur et celles compatibles avec les métriques intégrées :

Méthode API Monitoring	Utilisation avec des métriques définies par l'utilisateur	Utilisation avec des métriques intégrées
monitoredResourceDescriptors.get	oui	oui
monitoredResourceDescriptors.list	oui	oui
metricDescriptors.get	oui	oui
metricDescriptors.list	oui	oui
timeSeries.list	oui	oui
timeSeries.create	oui
metricDescriptors.create	oui
metricDescriptors.delete	oui

Limites et latences

Pour connaître les limites associées aux métriques définies par l'utilisateur et à la conservation des données, consultez la page Quotas et limites.

Pour conserver vos données de métriques au-delà de la période de conservation, vous devez : copier manuellement les données vers un autre emplacement, tel que Cloud Storage ou dans BigQuery.

Pour en savoir plus sur les latences associées à l'écriture de données dans les métriques définies par l'utilisateur, consultez la section Latence des données de métriques.

Étape suivante

Utilisez Google Cloud Managed Service pour Prometheus pour collecter des métriques Prometheus à partir d'applications exécutées sur Google Kubernetes Engine et Kubernetes.
Collectez des métriques Prometheus à partir de des applications exécutées sur Compute Engine.
Collectez des métriques et des traces OTLP à partir d'applications instrumentées avec OpenTelemetry et exécutées sur Compute Engine.
Créer des métriques définies par l'utilisateur avec l'API
Présentation de l'API Cloud Monitoring
Métriques, séries temporelles et ressources