Cloud Monitoring 代理从虚拟机实例收集系统和应用指标,并将其发送到 Monitoring。您还可以配置 Monitoring 代理以监控第三方应用。
本指南介绍如何在 Compute Engine 和 Amazon Elastic Compute Cloud (EC2) 虚拟机上安装用于 Monitoring 的 Cloud Monitoring 代理。代理不是强制使用的,但我们建议您对 Compute Engine 虚拟机实例使用。对于这些虚拟机,Monitoring 无需代理即可从虚拟机的 Hypervisor 访问某些指标,包括 CPU 利用率、某些磁盘流量指标、网络流量和正常运行时间。Amazon Elastic Compute Cloud (EC2) 虚拟机需要使用代理。
在运行 Microsoft Windows 系统的实例上,代理可记录 CPU 使用率和内存、页面文件和卷使用情况。如果您运行的是 IIS 或 SQL Server,则默认情况下,代理会从这些服务中收集指标。
须知事项
要安装该代理,请确保您拥有以下必备组件:
Google Cloud 项目或 Amazon Web Services (AWS) 账号中受支持的虚拟机实例。
- 运行 Monitoring 代理建议至少使用 250 MiB 的常驻 (RSS) 内存。
此外,请确保您的虚拟机运行的是受支持的操作系统。
虚拟机实例上授权与 Cloud Logging 或 Cloud Monitoring 进行通信的凭据。默认情况下,Compute Engine 虚拟机实例通常具有正确的凭据。如果您属于以下任一种情况,则说明您可能没有正确的凭据,必须完成为 Monitoring 代理授权过程:
运行 AWS EC2 虚拟机实例时,您必须先在虚拟机上安装授权凭据,然后才能安装代理。
运行非常旧的 Compute Engine 实例或者在未使用默认凭据的情况下创建的 Compute Engine 实例。
如需检查您是否具有正确的凭据,请运行验证 Compute Engine 凭据过程。
如需了解价格信息,请参阅 Google Cloud Observability 价格。
如果您使用的虚拟机无权访问远程软件包代码库,请参阅没有远程软件包访问权限的虚拟机部分。
通过命令行安装代理
如需使用命令行安装代理,请按照以下说明操作。
安装最新版本的代理
如需安装最新版本的代理,请完成以下步骤。
使用 SSH 或类似工具建立与虚拟机实例的终端连接,并确保您拥有
sudo
访问权限。切换到您具有写入权限的目录,例如您的主目录。
使用以下命令下载并运行代理安装脚本:
curl -sSO https://dl.google.com/cloudagents/add-monitoring-agent-repo.sh sudo bash add-monitoring-agent-repo.sh --also-install
安装完成后,该代理会自动启动。
使用 RDP 或类似工具连接到您的实例,然后登录到 Windows。
右键点击 PowerShell 图标并选择以管理员身份运行,以管理员权限打开 PowerShell 终端。
运行以下 PowerShell 命令:
(New-Object Net.WebClient).DownloadFile("https://repo.stackdriver.com/windows/StackdriverMonitoring-GCM-46.exe", "${env:UserProfile}\StackdriverMonitoring-GCM-46.exe") & "${env:UserProfile}\StackdriverMonitoring-GCM-46.exe"
安装特定版本代理
如需安装特定版本的代理,请完成以下步骤。
使用 SSH 或类似工具建立与虚拟机实例的终端连接,并确保您拥有
sudo
访问权限。切换到您具有写入权限的目录,例如您的主目录。
下载代理安装脚本:
curl -sSO https://dl.google.com/cloudagents/add-monitoring-agent-repo.sh
运行
add-monitoring-agent-repo.sh
脚本时,您还可以设置以下标志:--verbose
:在脚本执行期间启用详细日志记录。--also-install
:添加代理软件包代码库后安装代理。--version
:设置要安装的脚本的代理版本。 如需了解版本信息,请参阅列出所有代理版本。--uninstall
:卸载代理。--remove-repo
:安装或卸载代理后移除相应的代理软件包代码库。--dry-run
:仅触发脚本执行的试运行,并输出应执行的命令。
如需了解详情并查看示例注释,请参阅脚本注释。
添加代理的软件包代码库并安装代理:
如需列出可用的代理版本,请参阅列出所有代理版本。
对于生产环境,您可能需要固定到某个主要版本,以避免安装可能包含向后不兼容更改的主要版本。如需固定到某个主要版本,请运行以下命令:
sudo bash add-monitoring-agent-repo.sh --also-install \ --version=
MAJOR_VERSION.*.* 例如,如需固定到代理的 6.x.x 版本,请运行以下命令:
sudo bash add-monitoring-agent-repo.sh --also-install \ --version=6.*.*
如需安装代理的特定版本,请运行以下命令:
sudo bash add-monitoring-agent-repo.sh --also-install \ --version=
MAJOR_VERSION.MINOR_VERSION.PATCH_VERSION
启动代理服务
sudo service stackdriver-agent start
您可以在安装脚本成功运行后将其删除。
如需验证代理是否按预期工作,请运行以下命令:
sudo service stackdriver-agent status
代理的状态应为 OK。
您还可以检查日志并确保没有错误:
sudo grep collectd /var/log/{syslog,messages} | tail
如果您在安装时遇到问题,请参阅问题排查页面。
使用 RDP 或类似工具连接到您的实例,然后登录到 Windows。
右键点击 PowerShell 图标并选择以管理员身份运行,以管理员权限打开 PowerShell 终端。
运行以下 PowerShell 命令:
(New-Object Net.WebClient).DownloadFile("https://repo.stackdriver.com/windows/StackdriverMonitoring-GCM-46.exe", "${env:UserProfile}\StackdriverMonitoring-GCM-46.exe") & "${env:UserProfile}\StackdriverMonitoring-GCM-46.exe"
或者,您可以转到以下网址以下载并运行代理的安装程序:
https://repo.stackdriver.com/windows/StackdriverMonitoring-GCM-46.exe
要以静默方式安装代理,请将
/S
选项附加到安装程序的调用命令中:& "${env:UserProfile}\StackdriverMonitoring-GCM-46.exe" /S
在“静默”模式下,请使用
/D
选项指定安装目录,例如:& "${env:UserProfile}\StackdriverMonitoring-GCM-46.exe" /S /D="C:\Stackdriver\Monitoring\"
您可以在安装程序成功完成安装后将其删除。
如果您在安装时遇到问题,请参阅问题排查页面。
使用 Google Cloud 控制台查看代理信息
您可以在预配置的 Monitoring 虚拟机实例信息中心中找到有关代理的状态信息。如需访问此信息中心,请执行以下操作:
在 Google Cloud 控制台中,进入虚拟机实例信息中心页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
信息中心的清单标签页上的列表视图列出了所有虚拟机,并包含代理的状态列,如以下屏幕截图所示:
代理列会报告以下值:
未检测到:未安装代理或代理未运行。如果您不确定是否已安装代理,则可以查询已安装的版本。如果您已安装代理,则可以重启代理。
Ops Agent:您正在运行 Ops Agent。 如果您在条目旁边没有看到绿色对勾标记,则表示根据检测到的虚拟机操作系统,有可用的代理升级。
将鼠标悬停在表中的 Ops Agent 指示标志上时,您会看到有关 Ops Agent 版本的信息。如果您运行的是较旧版本,则还会看到升级代理的建议。
待处理:正在安装或升级 Ops Agent。
代理安装失败:Ops Agent 安装失败。
未收集遥测数据:Ops Agent 安装成功,但该代理尚未发送遥测数据。
旧版代理:您正在运行旧版 Monitoring 或 Logging 代理。如需了解如何转换到 Ops Agent,请参阅从旧版代理迁移到 Ops Agent。
不适用:此虚拟机不属于运行代理的受支持平台。
虚拟机已停止:虚拟机未运行,因此代理的状态未知。
您可以通过执行以下操作来安装 Ops Agent:
- 选择要在其中安装代理的虚拟机实例。
- 点击实例表中的安装/更新 Ops Agent 选项。
您还可以从特定虚拟机的虚拟机详情页面安装或更新 Ops Agent。
尽可能使用 Ops Agent 操作系统政策安装代理。如需了解详情,请参阅管理 Ops Agent 操作系统政策涵盖的虚拟机。并非所有操作系统的所有版本都支持 Ops Agent 操作系统政策。在这种情况下,点击安装/更新 Ops Agent 可提供一系列在 Cloud Shell 中运行的命令。
Ops Agent 默认会收集指标和日志。您可以通过配置 Ops Agent 来更改此默认行为。
可选任务
本部分介绍如何执行常见的维护任务。
配置 Monitoring 代理
如需调整代理配置,请参阅配置 Monitoring 代理。
配置 HTTP 代理
如果使用 HTTP 代理将请求代理到 Logging API 和 Monitoring API,则请执行以下操作:
修改以下配置文件(如果尚不存在,请创建该文件):
对于代理版本 6.0.0 及更高版本,请修改:
/etc/default/stackdriver-agent
对于 6.0.0 以下版本的代理,请修改您的操作系统对应的文件:
对于 Debian 和 Ubuntu,请修改:
/etc/default/stackdriver-agent
对于 CentOS 和 SLES,请修改:
/etc/default/stackdriver-collectd
将以下内容添加到该文件中:
export http_proxy="http://
proxy-ip :proxy-port " export https_proxy="http://proxy-ip :proxy-port " export no_proxy=169.254.169.254 # Skip proxy for the local Metadata Server.通过在虚拟机实例上运行以下命令来重启该代理。
sudo service stackdriver-agent restart
如果您使用的是 HTTP 代理,请通过管理员命令提示符运行以下命令。这样会设置
HTTP_PROXY
和HTTPS_PROXY
环境变量,以便代理可以使用出站 HTTPS 发送数据:setx HTTP_PROXY http://
proxy-ip :proxy-port /m setx HTTPS_PROXY http://proxy-ip :proxy-port /m setx no_proxy 169.254.169.254 /m
确定代理版本
要确定系统上 Monitoring 代理的版本,请在您的虚拟机实例上运行以下命令:
在 Amazon Linux、Red Hat 或 CentOS Linux 上运行以下命令:
rpm --query --queryformat '%{NAME} %{VERSION} %{RELEASE} %{ARCH}\n' stackdriver-agent
在 Debian 或 Ubuntu 上运行以下命令:
dpkg-query --show --showformat '${Package} ${Version} ${Architecture} ${Status}\n' stackdriver-agent
在 SUSE 上运行以下命令:
rpm --query --queryformat '%{NAME} %{VERSION} %{RELEASE} %{ARCH}\n' stackdriver-agent
目前无法确定在 Windows 系统上运行的 Monitoring 代理的版本。
重启代理
您必须重启 Monitoring 代理才能才能使配置文件中的更改生效。要重启代理,请按以下说明操作。
在您的实例上运行以下命令:
sudo service stackdriver-agent restart
使用 RDP 或类似工具连接到您的实例,然后登录到 Windows。
右键点击 PowerShell 图标并选择以管理员身份运行,以管理员权限打开 PowerShell 终端。
运行以下 PowerShell 命令:
Restart-Service -Name StackdriverMonitoring
升级代理
要将 Monitoring 代理升级到最新版本,请按以下说明操作:
如需将代理升级到最新版本,请运行以下命令:
sudo bash add-monitoring-agent-repo.sh --also-install
如需将代理升级到特定主要版本的最新版本,请运行以下命令:
sudo bash add-monitoring-agent-repo.sh --also-install \
--version=MAJOR_VERSION.*.*
如需升级到最新的代理版本,请按照此页面上在 Windows 上安装部分的说明安装最新代理。安装程序会提示您卸载以前的代理版本。
列出所有代理版本
如需列出代理的可用版本,请运行以下命令:
列出代理的可用版本:
sudo yum list --showduplicates stackdriver-agent
列出代理的可用版本:
sudo apt-cache madison stackdriver-agent
列出代理的可用版本:
sudo zypper search -s stackdriver-agent
不支持在 Windows 上安装代理的较早版本。
卸载代理
要移除 Monitoring 代理及其配置文件,请按以下说明操作。
卸载代理后,Google Cloud 控制台最多可能需要一小时才能报告此更改。
运行以下命令:
sudo bash add-monitoring-agent-repo.sh --uninstall
(可选)如需在卸载代理之外移除代码库,请将 --remove-repo
附加到上一个命令中。
在 Windows 控制面板中,选择卸载程序。您应该在可以卸载的程序列表中看到 Monitoring 代理。您还可以从 Monitoring 代理的安装目录运行 uninstall.exe
。
没有远程软件包访问权限的虚拟机
安装 Monitoring 代理时需要访问远程软件包代码库以获得代理软件包及其依赖项(在 Linux 上)。
如果您使用的是 VPC-SC 或专用网络,则网络配置还可能会影响您能否从上游代码库安装代理依赖项。您可以使用专用 Google 访问通道来访问代理软件包本身。 您可以按照启用专用 Google 访问通道中的说明进行配置。
如果虚拟机主机的安全政策拒绝访问远程软件包代码库,我们建议在预装代理的情况下创建自定义虚拟机映像,并在该映像中停用软件包管理。