Recopila métricas de recursos adicionales con el Agente de operaciones

En este documento, se describe cómo crear y ejecutar un trabajo por lotes que instale automáticamente el Agente de operaciones. Instala el agente de Ops para proporcionar métricas adicionales en Cloud Monitoring sobre el rendimiento de los recursos de una tarea. Para obtener más información sobre el uso de métricas de rendimiento de recursos para un trabajo, consulta Cómo supervisar y optimizar los recursos de un trabajo mediante las métricas.

Antes de comenzar

  1. Si nunca usaste Batch, consulta Cómo comenzar a usar Batch y habilita Batch completando los requisitos previos para proyectos y usuarios.
  2. Si tu proyecto aún no lo hizo, habilita las APIs de Cloud Monitoring y Cloud Logging:

    Enable the APIs

  3. Para obtener los permisos que necesitas para crear un trabajo, pídele a tu administrador que te otorgue los siguientes roles de IAM:

    Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

  4. A menos que uses la configuración predeterminada para la cuenta de servicio del trabajo, asegúrate de que tenga los permisos necesarios.

    Para garantizar que la cuenta de servicio del trabajo tenga los permisos necesarios para escribir métricas del agente de operaciones en la supervisión, pídele al administrador que le otorgue a la cuenta de servicio del trabajo los siguientes roles de IAM:

  5. Asegúrate de que la configuración de la tarea planificada cumpla con los requisitos del agente de operaciones.

Requisitos del agente de operaciones

Para crear y ejecutar una tarea que use el Agente de operaciones, esta debe cumplir con los siguientes requisitos:

Para obtener más información sobre las funciones y los requisitos del agente de operaciones, consulta la descripción general del agente de operaciones en la documentación de Google Cloud Observability.

Crea un trabajo que instale automáticamente el Agente de operaciones

Usa Google Cloud CLI o la API de REST para crear un trabajo que incluya el campo installOpsAgent configurado en true en el campo allocationPolicy.instances en el cuerpo principal del archivo JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Por ejemplo, un trabajo que instale automáticamente el agente de operaciones puede tener un archivo de configuración JSON similar al siguiente:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Una vez que las VMs de la tarea comiencen a ejecutarse, podrás ver las métricas del agente de operaciones de la misma manera que cualquier otra métrica de recursos. Para obtener más información, consulta Cómo supervisar y optimizar los recursos de trabajo a través de las métricas.

¿Qué sigue?