使用 Ops Agent 收集其他资源指标

本文档介绍了如何创建和运行 则系统会自动安装 Ops Agent。安装 Ops Agent 即可 Cloud Monitoring 中与作业性能相关的其他指标, 资源。详细了解如何使用资源性能指标 作业,请查看 通过查看指标监控和优化作业资源

准备工作

  1. 如果您以前没有使用过 Batch,请参阅 Batch 使用入门 并通过填写 针对项目和用户的前提条件
  2. 如果您的项目尚未启用,请启用 Cloud Monitoring API 和 Cloud Logging API:

    Enable the APIs

  3. 如需获取创建作业所需的权限, 请让管理员授予您 以下 IAM 角色:

    如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

  4. 除非您对 确保它具有必要的权限

    如需确保作业的服务账号具有将 Ops Agent 指标写入 Monitoring 所需的权限,请让您的管理员向作业的服务账号授予以下 IAM 角色:

  5. 确保您计划的作业配置符合 Ops Agent 要求

Ops Agent 要求

如需创建并运行使用 Ops Agent 的作业,您的作业必须符合 满足以下所有要求:

如需详细了解 Ops Agent 的功能和要求, 请参阅 Ops Agent 概览

创建自动安装 Ops Agent 的作业

使用 Google Cloud CLI 或 REST API 执行以下操作: 创建作业 包含 installOpsAgent 个字段 设置为 trueallocationPolicy.instances JSON 文件:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

例如,自动安装 Ops Agent 的作业可以具有类似于以下内容的 JSON 配置文件:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

作业的虚拟机开始运行后,您可以看到与 任何其他资源指标如需了解详情,请参阅 通过查看指标监控和优化作业资源

后续步骤