Coletar mais métricas de recursos usando o Agente de operações

Neste documento, descrevemos como criar e executar um job em lote que instala automaticamente o Agente de operações. Instale o Agente de operações para fornecer outras métricas no Cloud Monitoring sobre o desempenho da função do Google Cloud. Para saber mais sobre o uso de métricas de desempenho de recursos para um job, consulte Monitorar e otimizar recursos de jobs com a visualização de métricas.

Antes de começar

  1. Se você nunca usou o Batch, consulte Começar a usar o Batch e ative o Batch concluindo os pré-requisitos para projetos e usuários.
  2. Ative as APIs Cloud Monitoring e Cloud Logging, caso seu projeto ainda não tenha feito isso:

    Enable the APIs

  3. Para ter as permissões necessárias para criar um job, peça ao administrador para conceder a você os seguintes papéis do IAM:

    Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

    Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

  4. A menos que você esteja usando a configuração padrão para a conta de serviço do job, verifique se ela tem as permissões necessárias.

    Para garantir que a conta de serviço do job tenha as permissões necessárias para gravar métricas do agente de operações no Monitoring, peça ao administrador para conceder à conta de serviço do job os seguintes papéis do IAM:

  5. Certifique-se de que a configuração do job planejado atende Requisitos do Agente de operações.

Requisitos do Agente de operações

Para criar e executar um job que use o Agente de operações, ele precisa estar em conformidade com atender a todos os requisitos a seguir:

Para mais informações sobre os recursos e requisitos do Agente de operações, consulte Visão geral do Agente de operações na documentação de observabilidade do Google Cloud.

Criar um job que instale automaticamente o Agente de operações

Use a CLI do Google Cloud ou a API REST para criar um job que inclua o campo installOpsAgent definido como true no campo allocationPolicy.instances no corpo principal do arquivo JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Por exemplo, um job que instala automaticamente o Ops Agent pode ter um arquivo de configuração JSON semelhante ao seguinte:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Depois que as VMs do job começarem a ser executadas, você poderá conferir as métricas do Agente de operações da mesma forma que qualquer outra métrica de recurso. Para mais informações, consulte Monitorar e otimizar os recursos de jobs conferindo as métricas.

A seguir