Collecter des métriques de ressources supplémentaires à l'aide de l'Agent Ops

Ce document explique comment créer et exécuter une tâche par lot qui installe automatiquement l'agent Ops. Installez l'agent Ops pour fournir des métriques supplémentaires dans Cloud Monitoring sur les performances des ressources d'une tâche. Pour en savoir plus sur l'utilisation des métriques de performances des ressources pour un job, consultez la section Surveiller et optimiser les ressources de job en affichant des métriques.

Avant de commencer

  1. Si vous n'avez jamais utilisé Batch auparavant, consultez Premiers pas avec Batch et activez Batch en suivant la les conditions préalables pour les projets et les utilisateurs.
  2. Si votre projet ne l'a pas déjà fait, activez les API Cloud Monitoring et Cloud Logging:

    Enable the APIs

  3. Pour obtenir les autorisations nécessaires pour créer un job, demandez à votre administrateur de vous accorder les rôles IAM suivants :

    Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

    Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

  4. Sauf si vous utilisez la configuration par défaut pour le compte de service de la tâche, assurez-vous qu'il dispose des autorisations nécessaires.

    Pour s'assurer que le compte de service du job dispose des autorisations les autorisations requises pour écrire des métriques de l'agent Ops dans Monitoring ; demandez à votre administrateur d'accorder au compte de service du job rôles IAM suivants:

  5. Assurez-vous que la configuration de la tâche planifiée répond aux exigences de l'agent Ops.

Conditions requises pour l'Agent Ops

Pour que vous puissiez créer et exécuter une tâche qui utilise l'agent Ops, celle-ci doit respecter les toutes les exigences suivantes:

Pour en savoir plus sur les fonctionnalités et les exigences de l'agent Ops, consultez la section Présentation de l'agent Ops dans la documentation Google Cloud Observability.

Créer une tâche qui installe automatiquement l'agent Ops

Utilisez la Google Cloud CLI ou l'API REST pour créer une tâche qui inclut le champ installOpsAgent défini sur true dans le champ allocationPolicy.instances du corps principal du fichier JSON :

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Par exemple, un job qui installe automatiquement l'agent Ops peut avoir un fichier JSON de configuration Terraform semblable à celui-ci:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Une fois que les VM du job commencent à s'exécuter, les métriques de l'agent Ops s'affichent de la même manière que toute autre métrique liée aux ressources. Pour en savoir plus, consultez la section Surveiller et optimiser les ressources de tâche en affichant des métriques.

Étape suivante