Supervisa y optimiza los recursos de trabajo con las métricas

En este documento, se describe cómo supervisar y tratar de optimizar los recursos de un trabajo de por lotes a través de la visualización de métricas en Cloud Monitoring. Para obtener más información sobre los recursos en los que se ejecuta un trabajo, consulta Recursos de trabajo.

Para cualquier trabajo, Monitoring proporciona métricas básicas, como el uso de la CPU y el tráfico de red. Sin embargo, algunas métricas, como el uso de memoria y procesos, solo se pueden recopilar si un trabajo instala el Agente de operaciones. Las métricas de los recursos de una tarea te ayudan a evaluar el rendimiento y el uso de cada recurso. Esta información puede ayudarte a identificar mejoras para cualquier ejecución futura del trabajo. Por ejemplo, puedes quitar los recursos que no se usan para optimizar los costos, o bien mejorar o aumentar los recursos ajustados para mejorar el rendimiento.

Antes de comenzar

  1. Si nunca usaste Batch, revisa Comienza a usar Batch y habilitar Batch completando el requisitos previos para los proyectos y usuarios.
  2. Opcional: Si quieres recopilar métricas adicionales para un trabajo, crear y ejecutar un trabajo que instala automáticamente el Agente de operaciones.
  3. Si tu proyecto aún no lo ha hecho, habilita la API de Monitoring:

    Enable the API

  4. Para obtener los permisos que necesitas para ver las métricas de observabilidad, pídele a tu administrador que te otorgue el rol de IAM Visualizador de métricas de supervisión (roles/monitoring.metricViewer) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Consulta las métricas de los recursos del trabajo

El artículo Observa y supervisa VMs en la documentación de Compute Engine proporciona información conceptual relevante sobre las métricas de VM. Sin embargo, se recomiendan diferentes métodos para ver las métricas de VM de los trabajos por lotes. Específicamente, en la documentación de Compute Engine, se explica cómo ver las métricas con los paneles predefinidos de Monitoring para Compute Engine o las páginas de Compute Engine en la consola de Google Cloud. Pero lo más importante es que esos métodos no muestran información sobre las VMs que tienen se borró. Por lo tanto, no uses esos métodos a menos que solo quieras ver para los trabajos por lotes mientras se ejecutan.

Consulta las métricas de los trabajos por lotes en ejecución y terminados con los gráficos del Explorador de métricas, como se explica en esta sección. En particular, los gráficos son temporales, a menos que guardes paneles personalizados.

Si deseas crear un gráfico para ver una o más métricas, haz lo siguiente:

  1. Opcional: Si planeas guardar el gráfico, identificar o crear un panel personalizado para el gráfico.
  2. Crea un gráfico del Explorador de métricas para una o más métricas.

    Sin filtros, cada métrica de VM en un gráfico incluye datos de todas las VMs de tu proyecto. De manera opcional, si deseas filtrar el gráfico para que solo incluya métricas de todos los trabajos por lotes o de trabajos específicos, agrega el siguiente filtro:

    group=RESOURCE_GROUP_NAME
    

    Reemplaza RESOURCE_GROUP_NAME por el nombre de un grupo de recursos para trabajos por lotes. Para obtener más información, consulta Crea grupos de recursos para filtrar métricas en este documento.

Crea grupos de recursos para filtrar métricas

Puedes usar grupos de recursos como filtros personalizables para los gráficos del Explorador de métricas. Para crear un grupo de recursos para todos los trabajos por lotes o para trabajos específicos en Batch en tu proyecto, haz lo siguiente:

  1. Selecciona la etiqueta que quieres usar. como los criterios de membresía según los trabajos que desees incluir en el grupo:

    • Todos los trabajos por lotes: usa etiqueta batch-node predefinida, que se aplica automáticamente a todos los recursos para todos los trabajos por lotes y tiene un valor nulo.
    • Trabajos por lotes específicos: Usa una etiqueta que se aplique a los recursos solo para trabajos por lotes específicos.

      Por ejemplo, si quieres crear un grupo basado en trabajos completos o parciales usa el nombre predefinido de la etiqueta batch-job-id con un valor específico. La etiqueta batch-job-id se aplica automáticamente a todos los recursos de todos los trabajos por lotes y se define con el nombre del trabajo.

      Como alternativa, si usas una etiqueta personalizada, debes aplicar etiqueta personalizada a todos los recursos de los trabajos por lotes que que quieres que se incluya en el grupo cuando crees los trabajos.

  2. Asegúrate de que tu proyecto tenga al menos un trabajo con la etiqueta seleccionada y que este trabajo esté en el estado RUNNING. De lo contrario, esta etiqueta como opción cuando intentes crear el grupo de recursos.

  3. Crea un grupo de recursos. Cuando especifiques los criterios de membresía, haz lo siguiente:

    1. Configura el Tipo como Etiqueta.
    2. Establece el campo Etiqueta en el nombre de la etiqueta seleccionada. Luego, configura siguientes campos basados en los valores de etiqueta que quieres que el grupo incluir.

      Por ejemplo, si quieres que este grupo incluya todas trabajos, establece la Etiqueta en batch-node y el Operador como Exists. De manera alternativa, quieres que este grupo incluya trabajos por lotes con nombres que comienzan con test, establece Tag en batch-job-id Configura Operator (Operador) en Starts with (Comienza con) y Value (Valor) en test.

¿Qué sigue?