Descripción general de las métricas definidas por el usuario

Las métricas definidas por el usuario son todas aquellas que no las define Google Cloud. Entre ellas, se incluyen métricas que puedes definir y métricas que define una aplicación de terceros. Las métricas definidas por el usuario te permiten capturar datos específicos de la aplicación o datos del sistema del cliente. Las métricas integradas que recopila Cloud Monitoring pueden brindarte información sobre la latencia del backend o el uso del disco, pero no pueden decirte, por ejemplo, cuántas rutinas en segundo plano generó tu aplicación. También puedes crear métricas basadas en el contenido de las entradas de registro. Para obtener información sobre esos tipos de métricas, consulta Descripción general de las métricas basadas en registros.

Las métricas definidas por el usuario a veces se denominan métricas personalizadas o métricas específicas de la aplicación. Estas métricas te permiten a ti o a una aplicación de terceros definir y recopilar información que las métricas integradas de Cloud Monitoring no pueden. Tú capturas dichas métricas con una API que proporciona una biblioteca para instrumentar tu código y, luego, envías las métricas a una aplicación de backend como Cloud Monitoring.

Puedes crear métricas definidas por el usuario directamente con la API de Cloud Monitoring. Sin embargo, te recomendamos que uses OpenTelemetry. Para obtener información sobre cómo crear métricas definidas por el usuario, consulta los siguientes documentos:

  • En Recopilar métricas y seguimientos de OTLP, se describe cómo usar el Agente de operaciones y el receptor del protocolo OpenTelemetry (OTLP) del agente para recopilar métricas y seguimientos de aplicaciones instrumentadas con OpenTelemetry que se ejecutan en Compute Engine.

  • En Google Cloud Managed Service para Prometheus, se describe cómo recopilar métricas de Prometheus de aplicaciones que se ejecutan en Google Kubernetes Engine y Kubernetes.

  • En Recopilar métricas de Prometheus, se describe cómo usar el Agente de operaciones para recopilar métricas de Prometheus de aplicaciones que se ejecutan en Compute Engine.

  • En Crea métricas definidas por el usuario con la API, se describe cómo crear métricas mediante la API de Cloud Monitoring y cómo agregar datos de métricas a esas métricas. En este documento, se muestra cómo usar la API de Monitoring con ejemplos mediante el Explorador de APIs, C#, Go, Java, Node.js, PHP, Python y los lenguajes de programación Ruby.

  • En Crea métricas personalizadas en Cloud Run, se muestra cómo usar OpenTelemetry Collector como un agente de archivo adicional en implementaciones de Cloud Run.

En lo que respecta a Cloud Monitoring, puedes usar métricas definidas por el usuario, como las métricas integradas. Puedes crear gráficos, configurar alertas para ellos, leerlos y supervisarlos. Para obtener más información sobre cómo leer datos de métricas, consulta los siguientes documentos:

  • En Enumera los tipos de métricas y recursos, se explica cómo enumerar y examinar los tipos de métricas integradas y definidas por el usuario. Por ejemplo, puedes usar la información de ese documento para enumerar todos los descriptores de métricas definidos por el usuario en tu proyecto.
  • En Recupera datos de series temporales, se explica cómo recuperar datos de series temporales a partir de métricas con la API de Monitoring. Por ejemplo, en este documento, se describe cómo puedes usar la API para obtener el uso de CPU de las instancias de máquina virtual (VM) en tu proyecto de Google Cloud.

La consola de Google Cloud proporciona una página dedicada para ayudarte a ver el uso de las métricas definidas por el usuario. Para obtener información sobre el contenido de esta página, consulta Consulta el uso y diagnóstico de las métricas.

Descriptores de métricas para métricas definidas por el usuario

Cada tipo de métrica debe tener un descriptor de métrica que defina cómo se organizan los datos de la métrica. El descriptor de métrica también define las etiquetas para la métrica y el nombre de la métrica. Por ejemplo, las listas de métricas muestran los descriptores de métricas para todos los tipos de métricas integrados.

Cloud Monitoring puede crear el descriptor de métrica por ti mediante los datos de métricas que escribes, o puedes crear explícitamente el descriptor de métrica y, luego, escribir estos datos. En cualquier caso, debes decidir cómo quieres organizar tus datos de métricas.

Ejemplo de diseño

Supongamos que tienes un programa que se ejecuta en una sola máquina y que llama a los programas auxiliares A y B. Quieres contar la frecuencia con la que se llama a los programas A y B. También quieres saber cuándo se llama al programa A más de 10 veces por minuto y cuándo se llama al programa B más de 5 veces por minuto. Por último, supongamos que tienes un solo proyecto de Google Cloud y planeas escribir los datos en el recurso supervisado global.

En este ejemplo, se describen algunos diseños diferentes que puedes usar para las métricas definidas por el usuario:

  • Usas dos métricas: Metric-type-A cuenta las llamadas al programa A y Metric-type-B cuenta las llamadas al programa B. En este caso, Metric-type-A contiene 1 serie temporal y Metric-type-B contiene 1 serie temporal.

    Puedes crear una sola política de alertas con dos condiciones o puedes crear dos políticas de alertas, cada una con una condición, con este modo de datos. Una política de alertas puede admitir varias condiciones, pero tiene una sola configuración para los canales de notificaciones.

    Este modelo podría ser adecuado cuando no te interesan las similitudes de los datos entre las actividades que se supervisan. En este ejemplo, las actividades son la tasa de llamadas a los programas A y B.

  • Usas una sola métrica y una etiqueta para almacenar un identificador de programa. Por ejemplo, la etiqueta puede almacenar el valor A o B. Monitoring crea una serie temporal para cada combinación única de etiquetas. Por lo tanto, hay una serie temporal cuyo valor de etiqueta es A y otra serie cuyo valor de etiqueta es B.

    Al igual que con el modelo anterior, puedes crear una sola política de alertas o dos políticas de alertas. Sin embargo, las condiciones de la política de alertas son más complicadas. Una condición que genera un incidente cuando la frecuencia de llamadas del programa A supera un umbral debe usar un filtro que incluya solo los datos cuyo valor de etiqueta sea A.

    Una de las ventajas de este modelo es que es sencillo para calcular proporciones. Por ejemplo, puedes determinar qué cantidad del total se debe a las llamadas a A.

  • Usas una sola métrica para contar la cantidad de llamadas, pero no usas una etiqueta para registrar a qué programa se llamó. En este modelo, hay una sola serie temporal que combina los datos de los dos programas. Sin embargo, no puedes crear una política de alertas que cumpla con tus objetivos, ya que los datos de dos programas no se pueden separar.

Los primeros dos diseños te permiten cumplir con los requisitos de análisis de datos; sin embargo, el último no.

Para obtener más información, consulta Crea una métrica definida por el usuario.

Nombres de las métricas definidas por el usuario

Cuando creas una métrica definida por el usuario, defines un identificador de string que representa el tipo de métrica. Esta cadena debe ser única entre las métricas definidas por el usuario en tu proyecto de Google Cloud y debe usar un prefijo que marque la métrica como una definida por el usuario. Para Monitoring, los prefijos permitidos son custom.googleapis.com/, workload.googleapis.com/, external.googleapis.com/user y external.googleapis.com/prometheus. El prefijo va seguido de un nombre que describe lo que estás recopilando. Para obtener detalles sobre la forma recomendada de asignar un nombre a una métrica, consulta Convenciones de nombres de métricas. A continuación, se muestran ejemplos de los dos tipos de identificadores para los tipos de métricas:

    custom.googleapis.com/cpu_utilization
    custom.googleapis.com/instance/cpu/utilization

En el ejemplo anterior, el prefijo custom.googleapis.com indica que ambas métricas son métricas definidas por el usuario. Ambos ejemplos son para métricas que miden el uso de CPU; sin embargo, utilizan diferentes modelos organizativos. Cuando preves tener una gran cantidad de métricas definidas por el usuario, te recomendamos que uses una estructura de nombres jerárquica como la que se usa en el segundo ejemplo.

Todos los tipos de métricas tienen identificadores únicos a nivel global llamados nombres de recursos. La estructura de un nombre de recurso para un tipo de métrica es la siguiente:

projects/PROJECT_ID/metricDescriptors/METRIC_TYPE

En el ejemplo anterior, METRIC_TYPE es el identificador de string del tipo de métrica. Si los ejemplos de métricas anteriores se crean en el proyecto my-project-id, los nombres de recursos para estas métricas serían los siguientes:

    projects/my-project-id/metricDescriptors/custom.googleapis.com/cpu_utilization
    projects/my-project-id/metricDescriptors/custom.googleapis.com/instance/cpu/utilization

¿Nombre o tipo? En el descriptor de métrica, el campo name almacena el nombre del recurso del tipo de métrica y el campo type almacena la string METRIC_TYPE.

Tipos de recursos supervisados para métricas definidas por el usuario

Cuando escribes tus datos en una serie temporal, debes indicar de dónde provienen. Para especificar la fuente de los datos, debes elegir un tipo de recurso supervisado que represente de dónde provienen los datos y, luego, usarlo para describir el origen específico. El recurso supervisado no forma parte del tipo de métrica. En cambio, las series temporales en las que escribes datos incluyen una referencia al tipo de métrica y al recurso supervisado. El tipo de métrica describe los datos, mientras que el recurso supervisado describe dónde se originaron.

Considera el recurso supervisado antes de crear tu descriptor de métrica. El tipo de recurso supervisado que uses afecta las etiquetas que debes incluir en el descriptor de métrica. Por ejemplo, el recurso de VM de Compute Engine contiene etiquetas para el ID del proyecto, el ID de la instancia y la zona de la instancia. Por lo tanto, si planeas escribir tu métrica en un recurso de VM de Compute Engine, las etiquetas de recursos incluirán el ID de instancia, de modo que no necesitas una etiqueta para el ID de instancia en el descriptor de métrica.

Cada uno de los datos de tu métrica debe estar asociado con un objeto de recurso supervisado. Los datos de diferentes objetos de recursos supervisados se mantienen en diferentes series temporales.

Debes usar uno de los siguientes tipos de recurso supervisado con métricas definidas por el usuario:

Se suelen usar los objetos de recursos supervisados que representan los recursos físicos donde se ejecuta el código de tu aplicación. Este enfoque tiene varias ventajas:

  • Obtienes un mejor rendimiento en comparación con el uso de un solo tipo de recurso.
  • Evitas los datos fuera de orden causados por múltiples procesos que escriben en la misma serie temporal.
  • Puedes agrupar tus datos de métricas definidas por el usuario con otros datos de métricas de los mismos recursos.

global y recursos genéricos

Los tipos de recursos generic_task y generic_node son útiles en situaciones en las que ninguno de los tipos de recursos más específicos es apropiado. El tipo generic_task es útil para definir recursos similares a las tareas, como las aplicaciones. El tipo generic_node es útil para definir recursos similares a los nodos, como máquinas virtuales. Ambos tipos generic_* tienen varias etiquetas comunes que puedes usar a fin de definir objetos de recursos únicos, lo que facilita su uso en filtros de métricas para agregaciones y reducciones.

Por el contrario, el tipo de recurso global solo tiene etiquetas project_id y location. Cuando tienes muchas fuentes de métricas en un proyecto, usar el mismo objeto de recurso global puede causar colisiones y reemplazos de tus datos de métricas.

Métodos de API que admiten métricas definidas por el usuario

En la siguiente tabla, se muestra qué métodos de la API de Monitoring admiten métricas definidas por el usuario y qué métodos admiten métricas integradas:

Método de la API de Monitoring Se usan con
métricas definidas por el usuario
Permite el uso con
métricas integradas
monitoredResourceDescriptors.get
monitoredResourceDescriptors.list
metricDescriptors.get
metricDescriptors.list
timeSeries.list
timeSeries.create
metricDescriptors.create
metricDescriptors.delete

Límites y latencias

Para conocer los límites relacionados con las métricas definidas por el usuario y la retención de datos, consulta Cuotas y límites.

Para mantener tus datos de métricas más allá del período de retención, debes copiarlos de forma manual en otra ubicación, como Cloud Storage o BigQuery.

Para obtener información sobre las latencias asociadas con la escritura de datos en métricas definidas por el usuario, consulta Latencia de datos de métricas.

¿Qué sigue?