Coletar mais métricas de recursos usando o Agente de operações

Este documento descreve como criar e executar um job em lote que instala automaticamente o Agente de operações. Instale o Agente de operações para fornecer métricas adicionais no Cloud Monitoring sobre a performance dos recursos de um job. Para saber mais sobre o uso de métricas de desempenho de recursos para um job, consulte Monitorar e otimizar recursos de jobs com a visualização de métricas.

Antes de começar

  1. Se você nunca usou o Batch, consulte Começar a usar o Batch e ative o Batch concluindo os pré-requisitos para projetos e usuários.
  2. Ative as APIs Cloud Monitoring e Cloud Logging no seu projeto, se ainda não tiver feito isso:

    Enable the APIs

  3. Para receber as permissões necessárias para criar um job, peça ao administrador para conceder a você os seguintes papéis do IAM:

    Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

    Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

  4. A menos que você esteja usando a configuração padrão para a conta de serviço do job, verifique se ela tem as permissões necessárias.

    Para garantir que a conta de serviço do job tenha as permissões necessárias para gravar as métricas do agente de operações no Monitoring, peça ao administrador para conceder à conta de serviço do job os seguintes papéis do IAM:

  5. Verifique se a configuração do job planejado atende aos requisitos do Agente de operações.

Requisitos do agente de operações

Para criar e executar um job que usa o Agente de operações, ele precisa atender a todos os requisitos a seguir:

Para mais informações sobre os recursos e requisitos do agente de operações, consulte Visão geral do agente de operações na documentação do Google Cloud Observability.

Criar um job que instale automaticamente o agente de operações

Use a Google Cloud CLI ou a API REST para criar um job que inclua o campo installOpsAgent definido como true no campo allocationPolicy.instances no corpo principal do arquivo JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Por exemplo, um job que instala automaticamente o agente de operações pode ter um arquivo de configuração JSON semelhante ao seguinte:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Depois que as VMs do job começarem a ser executadas, você poderá conferir as métricas do Agente de operações da mesma forma que qualquer outra métrica de recurso. Para mais informações, consulte Monitorar e otimizar os recursos de jobs conferindo as métricas.

A seguir