Cette page a été traduite par l'API Cloud Translation.

Présentation des métriques définies par l'utilisateur

Les métriques définies par l'utilisateur sont toutes celles qui ne sont pas définies par Google Cloud. Celles-ci incluent des métriques que vous pouvez définir, ainsi que celles définies par une application tierce. Les métriques définies par l'utilisateur vous permettent de capturer des données spécifiques à une application ou des données système côté client. Les métriques intégrées collectées par Cloud Monitoring peuvent vous fournir des informations sur la latence du backend ou l'utilisation du disque, mais elles ne peuvent pas vous dire, par exemple, le nombre de routines en arrière-plan générées par votre application. Vous pouvez également créer des métriques basées sur le contenu des entrées de journal. Pour en savoir plus sur ces types de métriques, consultez la section Présentation des métriques basées sur les journaux.

Les métriques définies par l'utilisateur sont parfois appelées métriques personnalisées ou métriques spécifiques à une application. Ces métriques vous permettent, à vous-même ou à une application tierce, de définir et de collecter des informations que les métriques Cloud Monitoring intégrées ne peuvent pas obtenir. Vous capturez ces métriques à l'aide d'une API fournie par une bibliothèque pour instrumenter votre code, puis vous envoyez les métriques à une application backend telle que Cloud Monitoring.

Vous pouvez créer des métriques définies par l'utilisateur directement à l'aide de l'API Cloud Monitoring. Toutefois, nous vous recommandons d'utiliser OpenTelemetry. Pour en savoir plus sur la création de métriques définies par l'utilisateur, consultez les documents suivants:

La page Collecter des métriques et des traces OTLP explique comment utiliser l'agent Ops et le récepteur OTLP (OpenTelemetry Protocol) de l'agent pour collecter des métriques et des traces à partir d'applications instrumentées avec OpenTelemetry et exécutées sur Compute Engine.
Google Cloud Managed Service pour Prometheus explique comment collecter des métriques Prometheus à partir d'applications exécutées sur Google Kubernetes Engine et Kubernetes.
La page Collecter des métriques Prometheus explique comment utiliser l'agent Ops pour collecter des métriques Prometheus à partir d'applications s'exécutant sur Compute Engine.
La page Créer des métriques définies par l'utilisateur à l'aide de l'API explique comment créer des métriques à l'aide de l'API Cloud Monitoring et comment ajouter des données de métriques à ces métriques. Ce document explique comment utiliser l'API Monitoring avec des exemples utilisant les langages de programmation API Explorer, C#, Go, Java, Node.js, PHP, Python et Ruby.
La page Créer des métriques personnalisées sur Cloud Run montre comment utiliser le collecteur OpenTelemetry en tant qu'agent side-car dans les déploiements Cloud Run.

En ce qui concerne Cloud Monitoring, vous pouvez utiliser des métriques définies par l'utilisateur, telles que les métriques intégrées. Vous pouvez les représenter dans un graphique, y définir des alertes, les lire et les surveiller. Pour en savoir plus sur la lecture des données de métriques, consultez les documents suivants:

La section Répertorier les types de métriques et de ressources explique comment répertorier et examiner les types de métriques définis par l'utilisateur et intégrés. Par exemple, vous pouvez utiliser les informations de ce document pour répertorier tous les descripteurs de métrique définis par l'utilisateur dans votre projet.
La page Récupérer des données de séries temporelles explique comment récupérer des données de séries temporelles à partir de métriques à l'aide de l'API Monitoring. Par exemple, ce document explique comment utiliser l'API pour obtenir l'utilisation du processeur pour les instances de machine virtuelle (VM) de votre projet Google Cloud.

La console Google Cloud fournit une page dédiée vous permettant de consulter votre utilisation des métriques définies par l'utilisateur. Pour en savoir plus sur le contenu de cette page, consultez Afficher l'utilisation et les diagnostics des métriques.

Descripteurs de métriques pour les métriques définies par l'utilisateur

Chaque type de métrique doit disposer d'un descripteur de la métrique qui définit l'organisation des données de métrique. Le descripteur de la métrique définit également les libellés de la métrique et son nom. Par exemple, les listes de métriques affichent les descripteurs de tous les types de métriques intégrés.

Cloud Monitoring peut créer le descripteur de la métrique à votre place à l'aide des données de métriques que vous écrivez. Vous pouvez également créer explicitement le descripteur de métrique, puis écrire des données de métriques. Dans les deux cas, vous devez décider comment vous souhaitez organiser vos données de métriques.

Exemple de conception

Supposons que vous ayez un programme qui s'exécute sur une seule machine, et que ce programme appelle des programmes auxiliaires A et B. Vous souhaitez compter la fréquence à laquelle les programmes A et B sont appelés. Vous souhaitez également savoir quand le programme A est appelé plus de 10 fois par minute et lorsque le programme B est appelé plus de cinq fois par minute. Enfin, supposons que vous ayez un seul projet Google Cloud et que vous prévoyez d'écrire les données sur la ressource surveillée global.

Cet exemple décrit différentes conceptions que vous pouvez utiliser pour vos métriques définies par l'utilisateur:

Vous utilisez deux métriques: Metric-type-A compte les appels au programme A et Metric-type-B compte les appels au programme B. Dans ce cas, Metric-type-A contient une série temporelle et Metric-type-B contient une série temporelle.

Vous pouvez créer une seule règle d'alerte avec deux conditions ou deux règles d'alerte avec une condition avec ce mode de données. Une règle d'alerte peut accepter plusieurs conditions, mais elle possède une configuration unique pour les canaux de notification.

Ce modèle peut être approprié lorsque vous n'êtes pas intéressé par des similitudes entre les données des activités surveillées. Dans cet exemple, les activités correspondent au taux d'appels aux programmes A et B.
Vous utilisez une seule métrique et un libellé pour stocker un identifiant de programme. Par exemple, l'étiquette peut stocker la valeur A ou B. Monitoring crée une série temporelle pour chaque combinaison unique de libellés. Par conséquent, il existe une série temporelle dont la valeur de libellé est A et une autre série temporelle dont la valeur de libellé est B.

Comme avec le modèle précédent, vous pouvez créer une ou deux règles d'alerte. Cependant, les conditions de la règle d'alerte sont plus complexes. Une condition qui génère un incident lorsque le taux d'appels du programme A dépasse un seuil doit utiliser un filtre qui n'inclut que les points de données dont la valeur de libellé est A.

L'un des avantages de ce modèle est qu'il facilite le calcul des ratios. Par exemple, vous pouvez déterminer la somme totale due aux appels à A.
Vous utilisez une seule métrique pour compter le nombre d'appels, mais vous n'utilisez pas d'étiquette pour enregistrer le programme appelé. Dans ce modèle, il existe une seule série temporelle qui combine les données des deux programmes. Cependant, vous ne pouvez pas créer une règle d'alerte qui répond à vos objectifs, car les données de deux programmes ne peuvent pas être séparées.

Les deux premières conceptions vous permettent de répondre à vos exigences d'analyse de données, contrairement à la dernière.

Pour en savoir plus, consultez la section Créer une métrique définie par l'utilisateur.

Noms des métriques définies par l'utilisateur

Lorsque vous créez une métrique définie par l'utilisateur, vous définissez un identifiant de chaîne qui représente le type de métrique. Cette chaîne doit être unique parmi les métriques définies par l'utilisateur dans votre projet Google Cloud et utiliser un préfixe qui la marque comme une métrique définie par l'utilisateur. Pour Monitoring, les préfixes autorisés sont custom.googleapis.com/, workload.googleapis.com/, external.googleapis.com/user et external.googleapis.com/prometheus. Le préfixe est suivi d'un nom qui décrit ce que vous collectez. Pour en savoir plus sur la méthode recommandée pour nommer une métrique, consultez la section Conventions d'attribution de noms des métriques. Voici des exemples des deux genres d'identifiants employés pour les types de métriques :

    custom.googleapis.com/cpu_utilization
    custom.googleapis.com/instance/cpu/utilization

Dans l'exemple précédent, le préfixe custom.googleapis.com indique que les deux métriques sont définies par l'utilisateur. Les deux exemples concernent les métriques qui mesurent l'utilisation du processeur. Toutefois, ils utilisent des modèles organisationnels différents. Si vous prévoyez un grand nombre de métriques définies par l'utilisateur, nous vous recommandons d'utiliser une structure de dénomination hiérarchique comme celle utilisée dans le deuxième exemple.

Tous les types de métriques possèdent des identifiants uniques globaux appelés noms de ressources. La structure d'un nom de ressource pour un type de métrique est la suivante :

projects/PROJECT_ID/metricDescriptors/METRIC_TYPE

où METRIC_TYPE est l'identifiant de chaîne du type de métrique. Si les exemples de métriques précédents sont créés dans le projet my-project-id, leur nom de ressource pour ces métriques serait le suivant:

    projects/my-project-id/metricDescriptors/custom.googleapis.com/cpu_utilization
    projects/my-project-id/metricDescriptors/custom.googleapis.com/instance/cpu/utilization

Nom ou type ? Dans le descripteur de métrique, le champ name enregistre le nom de ressource du type de métrique et le champ type enregistre la chaîne METRIC_TYPE.

Types de ressources surveillées pour les métriques définies par l'utilisateur

Lorsque vous écrivez vos données dans une série temporelle, vous devez indiquer leur origine. Pour spécifier la source des données, vous devez choisir un type de ressource surveillée qui représente la provenance de vos données, puis l'utiliser pour décrire l'origine spécifique. La ressource surveillée ne fait pas partie du type de métrique. À la place, la série temporelle dans laquelle vous écrivez des données inclut une référence au type de métrique et à la ressource surveillée. Le type de métrique décrit les données, tandis que la ressource surveillée décrit l'origine des données.

Examinez la ressource surveillée avant de créer votre descripteur de la métrique. Le type de ressource surveillée que vous utilisez a une incidence sur les libellés que vous devez inclure dans le descripteur de métrique. Par exemple, la ressource de VM Compute Engine contient des étiquettes pour l'ID de projet, l'ID d'instance et la zone de l'instance. Par conséquent, si vous envisagez d'écrire votre métrique sur une ressource de VM Compute Engine, les libellés de ressource incluent l'ID d'instance. Vous n'avez donc pas besoin d'un libellé pour l'ID d'instance dans le descripteur de la métrique.

Chacun des points de données de votre métrique doit être associé à un objet de type "ressource surveillée". Les points des différents objets de ressource surveillée sont consignés dans différentes séries temporelles.

Vous devez utiliser l'un des types de ressources surveillées suivants avec des métriques définies par l'utilisateur:

aws_ec2_instance : instance Amazon EC2.
dataflow_job : tâche Dataflow.
gae_instance : instance App Engine.
gce_instance : instance Compute Engine.
generic_node : nœud de calcul spécifié par l'utilisateur.
generic_task : tâche définie par l'utilisateur.
gke_container : instance de conteneur GKE.
global : utilisez cette ressource lorsqu'aucun autre type de ressource ne convient. Dans la plupart des cas d'utilisation, il est préférable d'utiliser generic_node ou generic_task que global.
k8s_cluster : cluster Kubernetes.
k8s_container : conteneur Kubernetes.
k8s_node : nœud Kubernetes
k8s_pod : pod Kubernetes

Une pratique courante consiste à utiliser les objets de type "ressource surveillée" représentant les ressources physiques sur lesquelles le code de votre application est exécuté. Cette approche présente plusieurs avantages :

Vous obtenez de meilleures performances par rapport à l'utilisation d'un seul type de ressource.
Vous évitez les données hors service causées par plusieurs processus écrivant dans la même série temporelle.
Vous pouvez regrouper vos données de métriques définies par l'utilisateur avec d'autres données de métriques provenant des mêmes ressources.

`global` et les ressources génériques

Les types de ressources generic_task et generic_node sont utiles lorsqu'aucun des types de ressources plus spécifiques n'est approprié. Le type generic_task sert à définir des ressources de type "tâche", telles que des applications. Le type generic_node sert à définir des ressources de type "nœud", telles que des machines virtuelles. Les deux types generic_* ont plusieurs libellés communs dont vous pouvez vous servir pour définir des objets de ressource uniques. Cela facilite leur utilisation dans les filtres de métriques pour les agrégations et les réductions.

En revanche, le type de ressource global ne dispose que des libellés project_id et location. Lorsque vous disposez de plusieurs sources de métriques dans un projet, l'utilisation du même objet de ressource global peut entraîner des conflits et des écrasements de vos données de métriques.

Méthodes d'API compatibles avec les métriques définies par l'utilisateur

Le tableau suivant indique les méthodes de l'API Monitoring qui acceptent les métriques définies par l'utilisateur et celles qui sont compatibles avec les métriques intégrées:

Méthode API Monitoring	À utiliser avec des métriques définies par l'utilisateur	Utilisation avec des métriques intégrées
monitoredResourceDescriptors.get	oui	oui
monitoredResourceDescriptors.list	oui	oui
metricDescriptors.get	oui	oui
metricDescriptors.list	oui	oui
timeSeries.list	oui	oui
timeSeries.create	oui
metricDescriptors.create	oui
metricDescriptors.delete	oui

Limites et latences

Pour connaître les limites liées aux métriques définies par l'utilisateur et à la conservation des données, consultez la page Quotas et limites.

Pour conserver les données de métriques au-delà de la durée de conservation, vous devez les copier manuellement vers un autre emplacement, tel que Cloud Storage ou BigQuery.

Pour en savoir plus sur les latences associées à l'écriture de données dans des métriques définies par l'utilisateur, consultez la section Latence des données de métriques.

Étapes suivantes

Utilisez Google Cloud Managed Service pour Prometheus pour collecter des métriques Prometheus à partir d'applications exécutées sur Google Kubernetes Engine et Kubernetes.
Collectez des métriques Prometheus à partir d'applications s'exécutant sur Compute Engine.
collecter des métriques et des traces OTLP à partir d'applications instrumentées à l'aide d'OpenTelemetry et de l'exécution sur Compute Engine ;
Créer des métriques définies par l'utilisateur avec l'API
Présentation de l'API Cloud Monitoring
Métriques, séries temporelles et ressources