Raccogli metriche aggiuntive sulle risorse utilizzando Ops Agent

Questo documento descrive come creare ed eseguire un job batch che installa automaticamente l'agente Ops. Installa Ops Agent per fornire altre metriche in Cloud Monitoring sul rendimento delle risorse di un job. Per scoprire di più sull'utilizzo delle metriche delle prestazioni delle risorse per un lavoro, vedi Monitorare e ottimizzare le risorse del job visualizzando le metriche.

Prima di iniziare

  1. Se non hai mai utilizzato Batch, rivedi Inizia a utilizzare Batch e abilita Batch, completando prerequisiti per progetti e utenti.
  2. Se non l'hai ancora fatto, abilita le API Cloud Monitoring e Cloud Logging nel tuo progetto:

    Enable the APIs

  3. Per ottenere le autorizzazioni necessarie per creare un job, chiedi all'amministratore di concederti i seguenti ruoli IAM:

    Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

    Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

  4. A meno che tu non stia utilizzando la configurazione predefinita per l'account di servizio del job, assicurati che disponga delle autorizzazioni necessarie.

    Per garantire che l'account di servizio del job abbia gli elementi necessari autorizzazioni per scrivere metriche di Ops Agent in Monitoring, chiedi all'amministratore di concedere all'account di servizio del job seguenti ruoli IAM:

  5. Assicurati che la configurazione del job pianificato soddisfi i requisiti di Ops Agent.

Requisiti di Ops Agent

Per creare ed eseguire un job che utilizza Ops Agent, il job deve rispettare le tutti i seguenti requisiti:

Per saperne di più sulle funzionalità e sui requisiti di Ops Agent, consulta la Panoramica di Ops Agent nella documentazione di Google Cloud Observability.

Crea un job che installi automaticamente l'agente operativo

Utilizza Google Cloud CLI o l'API REST per creare un job che include il campo installOpsAgent impostato su true nel campo allocationPolicy.instances nel corpo principale del file JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Ad esempio, un job che installa automaticamente Ops Agent può avere un file di configurazione JSON simile al seguente:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Dopo l'avvio delle VM del job, puoi visualizzare le metriche di Ops Agent come qualsiasi altra metrica delle risorse. Per ulteriori informazioni, consulta Monitorare e ottimizzare le risorse dei job visualizzando le metriche.

Passaggi successivi