Recopila métricas de recursos adicionales con el Agente de operaciones

En este documento, se describe cómo crear y ejecutar un trabajo por lotes instala automáticamente el Agente de operaciones. Instala el agente de Ops para proporcionar métricas adicionales en Cloud Monitoring sobre el rendimiento de los recursos de un trabajo. Para obtener más información sobre el uso de métricas de rendimiento de recursos para un trabajo, consulta Cómo supervisar y optimizar los recursos de trabajo a través de las métricas.

Antes de comenzar

  1. Si nunca usaste Batch, revisa Comienza a usar Batch y habilitar Batch completando el requisitos previos para los proyectos y usuarios.
  2. Si tu proyecto aún no se ha hecho, habilita las APIs de Cloud Monitoring y Cloud Logging:

    Enable the APIs

  3. Para obtener los permisos que necesitas para crear un trabajo, pídele a tu administrador que te otorgue los siguientes roles de IAM:

    Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

  4. A menos que uses la configuración predeterminada para la cuenta de servicio del trabajo asegurarse de que cuenta con los permisos necesarios.

    Para garantizar que la cuenta de servicio del trabajo tenga los permisos necesarios para escribir métricas del agente de operaciones en la supervisión, pídele al administrador que le otorgue a la cuenta de servicio del trabajo los siguientes roles de IAM:

  5. Asegúrate de que la configuración de tu trabajo planificado cumpla con los Requisitos del Agente de operaciones

Requisitos del Agente de operaciones

Para crear y ejecutar una tarea que use el Agente de operaciones, esta debe cumplir con todos los siguientes requisitos:

Para obtener más información sobre las funciones y los requisitos del agente de operaciones, consulta la descripción general del agente de operaciones en la documentación de Google Cloud Observability.

Crea un trabajo que instale automáticamente el Agente de operaciones

Usa Google Cloud CLI o la API de REST para crear un trabajo incluye el Campo installOpsAgent Establécelo en true en el campo allocationPolicy.instances del cuerpo principal de la Archivo JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Por ejemplo, un trabajo que instale automáticamente el agente de operaciones puede tener un archivo de configuración JSON similar al siguiente:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Después de que las VMs del trabajo comiencen a ejecutarse, podrás ver las métricas del Agente de operaciones al igual que para cualquier otra métrica de recursos. Para obtener más información, consulta Supervisa y optimiza los recursos de trabajo a través de las métricas.

¿Qué sigue?