Collecter des métriques de ressources supplémentaires à l'aide de l'agent Ops

Ce document explique comment créer et exécuter une tâche par lot qui installe automatiquement l'agent Ops. Installez l'agent Ops pour fournir des métriques supplémentaires dans Cloud Monitoring sur les performances des ressources d'une tâche. Pour en savoir plus sur l'utilisation des métriques de performances des ressources pour un job, consultez la section Surveiller et optimiser les ressources de job en affichant des métriques.

Avant de commencer

  1. Si vous n'avez jamais utilisé Batch, consultez Premiers pas avec Batch et activez Batch en remplissant les conditions préalables pour les projets et les utilisateurs.
  2. Si ce n'est pas déjà fait, activez les API Cloud Monitoring et Cloud Logging dans votre projet :

    Enable the APIs

  3. Pour obtenir les autorisations nécessaires pour créer un job, demandez à votre administrateur de vous accorder les rôles IAM suivants:

    Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

    Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

  4. À moins que vous n'utilisiez la configuration par défaut pour le compte de service de la tâche, assurez-vous qu'il dispose des autorisations nécessaires.

    Pour vous assurer que le compte de service de la tâche dispose des autorisations nécessaires pour écrire des métriques de l'agent Ops dans la surveillance, demandez à votre administrateur d'accorder au compte de service de la tâche les rôles IAM suivants:

  5. Assurez-vous que la configuration de la tâche planifiée répond aux exigences de l'agent Ops.

Exigences concernant l'agent Ops

Pour créer et exécuter une tâche qui utilise l'agent Ops, votre tâche doit respecter toutes les exigences suivantes:

Pour en savoir plus sur les fonctionnalités et les exigences de l'agent Ops, consultez la section Présentation de l'agent Ops dans la documentation Google Cloud Observability.

Créer une tâche qui installe automatiquement l'agent Ops

Utilisez la Google Cloud CLI ou l'API REST pour créer une tâche qui inclut le champ installOpsAgent défini sur true dans le champ allocationPolicy.instances du corps principal du fichier JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Par exemple, une tâche qui installe automatiquement l'agent Ops peut avoir un fichier de configuration JSON semblable à celui-ci:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Une fois que les VM du job commencent à s'exécuter, vous pouvez consulter les métriques de l'agent Ops comme n'importe quelle autre métrique de ressource. Pour en savoir plus, consultez la section Surveiller et optimiser les ressources de tâche en affichant des métriques.

Étape suivante