本文档介绍了如何创建和运行 则系统会自动安装 Ops Agent。安装 Ops Agent 即可 Cloud Monitoring 中与作业性能相关的其他指标, 资源。详细了解如何使用资源性能指标 作业,请查看 通过查看指标监控和优化作业资源。
准备工作
- 如果您以前没有使用过 Batch,请参阅 Batch 使用入门 并通过填写 针对项目和用户的前提条件。
- 如果您的项目尚未启用,请启用 Cloud Monitoring API 和 Cloud Logging API:
-
如需获取创建作业所需的权限, 请让管理员授予您 以下 IAM 角色:
-
如需创建作业,请执行以下操作:
-
Batch Job Editor (
roles/batch.jobsEditor
) 针对项目 -
Service Account User (
roles/iam.serviceAccountUser
) 服务账号用户 针对作业的服务账号,该账号默认为默认 Compute Engine 服务账号
-
Batch Job Editor (
-
如需查看日志,请执行以下操作:
日志查看器 (
roles/logging.viewer
) 针对项目
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
-
如需创建作业,请执行以下操作:
-
如需确保作业的服务账号具有将 Ops Agent 指标写入 Monitoring 所需的权限,请让您的管理员向作业的服务账号授予以下 IAM 角色:
-
Monitoring 指标写入者 (
roles/monitoring.metricWriter
) 针对项目 -
Logs Writer (
roles/logging.logWriter
) 针对项目
-
Monitoring 指标写入者 (
- 确保您计划的作业配置符合 Ops Agent 要求。
Ops Agent 要求
如需创建并运行使用 Ops Agent 的作业,您的作业必须符合 满足以下所有要求:
确保作业的虚拟机使用的是 Ops Agent 支持的操作系统 (OS)。如需详细了解作业的虚拟机操作系统映像,请参阅作业虚拟机操作系统环境概览。
如果您的作业使用非默认的网络配置或使用 VPC Service Controls,请确保该作业符合 Ops Agent 的访问权限要求。如需了解详情,请参阅 无权访问远程软件包的虚拟机 。
确保该作业不会安装旧版 Cloud Logging 代理或 Cloud Monitoring 代理,例如,通过自定义映像或 实例模板。
如需详细了解 Ops Agent 的功能和要求, 请参阅 Ops Agent 概览 。
创建自动安装 Ops Agent 的作业
使用 Google Cloud CLI 或 REST API 执行以下操作:
创建作业
包含
installOpsAgent
个字段
设置为 true
,allocationPolicy.instances
JSON 文件:
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
}
例如,自动安装 Ops Agent 的作业可以具有类似于以下内容的 JSON 配置文件:
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello World! This is task $BATCH_TASK_INDEX."
}
}
]
},
"taskCount": 3,
}
],
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
作业的虚拟机开始运行后,您可以看到与 任何其他资源指标如需了解详情,请参阅 通过查看指标监控和优化作业资源。