Compute Engine 快速入门

本页面介绍如何使用 Stackdriver 监控 Compute Engine 虚拟机 (VM) 实例:如果要监控 Amazon EC2 虚拟机实例,请参阅 Amazon EC2 快速入门

在本快速入门中,您会执行以下操作:

  1. 创建一个 Compute Engine 虚拟机实例。
  2. 安装 Apache HTTP Server。
  3. 安装 Stackdriver Monitoring 和 Logging 代理。
  4. 创建正常运行时间检查及提醒政策。
  5. 创建自定义信息中心和图表。
  6. 查看日志。
  7. 清理。

准备工作

要使用 Stackdriver Monitoring,您需要先创建 GCP 项目、为该项目启用结算功能,再将项目与一个工作区关联。

创建项目

要创建项目,请执行以下操作:

  1. 在 GCP Console 中,转到新建项目

    创建新项目

  2. 项目名称字段中,输入 Quickstart

  3. 点击创建

要为您的项目启用结算功能,请执行以下操作:

  1. 在 GCP Console 中,转到结算

    转到“结算”

  2. 选择您的 Quickstart 项目(如果它尚未在页面顶部处于选中状态)。

  3. 系统会提示您选择现有付款资料或创建新的付款资料。

创建工作区

要为现有 GCP 项目创建工作区,请执行以下操作:

  1. 转到 GCP Console。

    转到 GCP Console

  2. 在菜单栏中,点击 Google Cloud Platform 旁边的下拉列表,然后选择您的 GCP 项目。

  3. 点击 Monitoring

  4. 如果系统显示将您的项目添加到工作区 (Add your project to a Workspace) 对话框,请通过选择新的工作区 (New Workspace) 下的 GCP 项目,然后点击添加来创建新的工作区。在下图中,GCP 项目名称为 Quickstart

    选择工作区

    仅当您至少有一个现有工作区可用时,系统才会显示将您的项目添加到工作区 (Add your project to a Workspace) 对话框。现有工作区 (Existing Workspace) 下列出的工作区是您已经创建的工作区,或者您拥有修改权限的 GCP 项目的工作区。使用此对话框,您可以选择创建新的工作区,也可以选择将您的项目添加到现有工作区。

接下来,Monitoring 会创建一个新的工作区,并将您的 GCP 项目添加到该工作区。在创建工作区期间,Monitoring 会经历以下阶段:

  1. 构建工作区
  2. 启用 Stackdriver API
  3. 我们仍在为您的新工作区收集数据

这些阶段可能需要几分钟才能完成。完成后,Stackdriver Monitoring 控制台会显示 Monitoring 概览 (Monitoring Overview) 窗格和欢迎消息:

选择工作区

创建 Compute Engine 实例

  1. 在 GCP Console 中,转到计算 > Compute Engine

    转到 Compute Engine

  2. 要创建虚拟机实例,请点击创建

  3. 按如下所示填写实例的各个字段:

    • 名称字段中,输入 lamp-1-vm
    • 机器类型字段中,选择小型
    • 防火墙字段中,选择允许 HTTP 流量允许 HTTPS 流量

    其他字段保留默认值。

  4. 点击创建。等待几分钟,让您的实例在“虚拟机实例”页面上启动。

  5. 要打开一个连接到该实例的终端,请在连接列中点击 SSH

  6. 更新该实例上的软件包列表。

    sudo apt-get update
    
  7. 设置 Apache2 HTTP Server。

    sudo apt-get install apache2 php7.0
    
  8. 打开浏览器,并使用网址 http://[External IP] 连接至您的 Apache2 HTTP Server。将 [External IP] 替换为 Compute Engine 实例的外部 IP 地址。您会看到如下 Apache2 默认页面:

    Apache2 默认页面

安装 Stackdriver 代理

Stackdriver Monitoring 和 Logging 代理将您的虚拟机实例中的日志和指标传递到 Monitoring 和 Logging 中:

  1. 切换到连接至您的虚拟机实例的终端,或创建一个新终端。

  2. 安装 Stackdriver Monitoring 代理。

    curl -sSO https://dl.google.com/cloudagents/install-monitoring-agent.sh
    sudo bash install-monitoring-agent.sh
    
  3. 安装 Stackdriver Logging 代理。

    curl -sSO https://dl.google.com/cloudagents/install-logging-agent.sh
    sudo bash install-logging-agent.sh --structured
    

    --structured 标志允许 Logging 代理将结构化数据发送到 Stackdriver Logging。如需了解详情,请参阅结构化日志记录操作

创建正常运行时间检查

正常运行时间检查用于验证您的网络服务器可以从世界各地访问。提醒政策用于指定在未通过正常运行时间检查时该通知谁。

要创建使用正常运行时间检查的提醒政策,请执行以下操作:

  1. 返回到 Stackdriver Monitoring 控制台。

    转至 Monitoring

  2. 如果在信息中心上看到创建正常运行时间检查 (Create an Uptime Check) 的邀请,请点击此邀请。否则,请转到正常运行时间检查 (Uptime Checks) > 正常运行时间检查概览 (Uptime Checks Overview),然后点击添加正常运行时间检查 (Add Uptime Check) 或创建正常运行时间检查 (Create an Uptime Check)。

  3. 填写新的正常运行时间检查的以下字段:

    • 名称字段中,输入 My Uptime Check
    • 资源类型下拉列表中,选择实例
    • 应用对象字段中,输入 Single, lamp-1-vm
    • 其他字段保留默认值。

      创建正常运行时间检查

  4. 要验证正常运行时间检查是否有效,请点击测试。如果您看到“连接错误 - 已拒绝”(Connection error - refused) 消息,则表明您可能尚未安装 Apache HTTP Server,或者您可能指定了 HTTPS(而非 HTTP)检查类型。如果看到其他错误,请参阅验证正常运行时间检查

  5. 您点击保存后,系统会显示以下对话框:

    正常运行时间检查已创建

创建提醒政策

  1. 正常运行时间检查已创建 (Uptime Check Created) 窗格中,点击创建提醒政策 (Create Alerting Policy)。

  2. Untitled Condition 字段中,输入提醒政策条件的标题。条件窗格中的所有其他字段将从您创建的正常运行时间检查中自动填充。

    创建条件

  3. 点击保存

  4. 通知渠道类型 (Notification Channel Type) 下拉列表中,选择电子邮件

    创建新的提醒政策

  5. 输入您的电子邮件,然后点击 Add Notification Channel

  6. 为此政策命名 (Name this policy) 窗格中,输入 My Uptime Check Policy

  7. 点击保存。您会看到该政策的摘要。

创建信息中心和图表

这一步是要在您自己的图表和信息中心里显示由 Monitoring 收集的指标:

  1. 在 Stackdriver Monitoring 控制台中,转到信息中心 > 创建信息中心

    转到“创建信息中心”页面

  2. 在右上角,点击添加图表 (Add Chart)。

  3. 添加图表 (Add Chart) 窗口中,点击指标标签页。

    添加空白图表

  4. 查找资源类型和指标 (Find resource type and metric) 标题下的实例、CPU、使用情况等等 (instance, cpu, usage, etc.) 字段中,输入 CPU,然后从下拉列表中选择 CPU 负载 (1m) (CPU load(1m))。其他字段保留默认值。

  5. 当新图表出现在面板的预览部分中时,点击保存

    添加图表

  6. 要创建第二个图表,请点击添加图表 (Add Chart)。

  7. 点击指标标签页。

  8. 查找资源类型和指标 (Find resource type and metric) 下拉列表中,选择接收的字节数。其他字段保留默认值。

  9. 当新图表出现在预览部分中时,点击保存

  10. 在新的信息中心中,将未命名的信息中心 (Untitled Dashboard) 更改为 Stackdriver quickstart dashboard

对检查和提醒进行测试

此流程最长可能需要 40 分钟。其中包含一个供您参考的示例时间轴。在此时间轴中,当前时间为 12:00。

12:00 等待

返回到 Stackdriver Monitoring 控制台。等到 My Uptime Check 旁边的图标从内含感叹号的灰色圈变为内含对勾标记的绿色圈:此阶段的最长等待时间为 25 分钟。

正常运行时间检查通行证

12:15 My Uptime Check 图标为绿色。对检查和提醒进行测试。

转到虚拟机实例页面,选择您的实例,然后点击停止

12:25 收到提醒通知。

重启虚拟机,解决“问题”。返回到虚拟机实例页面,选择您的实例,然后点击启动

12:40 事件解决

再次收到提醒通知。

查看日志

Monitoring 和 Logging 是紧密集成在一起的。要查看您的日志,请执行以下操作:

  1. Stackdriver Monitoring 控制台中,点击 Logging

    转到 Stackdriver Logging

  2. 更改日志查看器设置以查看您要看的日志:

    • 在第一个下拉列表中,选择 G​C​E 虚拟机实例 lamp-1-vm
    • 在第二个下拉列表中,选择 syslog,然后点击确定
    • 其他字段保留默认值。系统会显示虚拟机实例中的日志。

      从控制台查看日志

  3. 返回到 Stackdriver Monitoring 控制台。要查看日志,请在其中一个图表中,点击菜单图标,然后点击查看日志

    从图表查看日志

清理

为避免系统因本快速入门中使用的资源向您的 GCP 帐号收取费用,请执行以下操作:

清理 Stackdriver

移除您的 Stackdriver 提醒政策、正常运行时间检查和图表,以免关停虚拟机实例时发生错误。

要删除您的提醒政策,请执行以下操作:

  1. Stackdriver Monitoring 控制台中,转到提醒 > 政策概览 (Policies Overview)。

  2. 点击要移除的政策旁边的删除

要删除正常运行时间检查,请执行以下操作:

  1. Stackdriver Monitoring 控制台中,转到正常运行时间检查 (Uptime Checks) > 我的正常运行时间检查 (My Uptime Check)。

  2. 点击 Delete uptime check

要删除您的图表,请执行以下操作:

  1. Stackdriver Monitoring 控制台中,转到信息中心 > Stackdriver 快速入门信息中心 (Stackdriver quickstart dashboard)。

  2. 对于每个图表,点击删除

  3. 信息中心为空时,请点击菜单图标,然后点击删除

  4. 在“确认图表删除”(Confirm Chart Deletion) 面板中,点击删除

删除虚拟机实例

  1. 在 GCP Console 中,转到“虚拟机实例”页面。

    转到“虚拟机实例”页面

  2. 点击 要删除的实例旁边的复选框。
  3. 点击页面顶部的删除按钮以删除实例。

删除项目

  1. 在 GCP Console 中,转到“项目”页面。

    转到“项目”页面

  2. 在项目列表中,选择要删除的项目,然后点击删除
  3. 在对话框中输入项目 ID,然后点击关闭以删除项目。

后续步骤

  • 请参阅支持的指标,获取指标列表。如果您想创建自己的 Monitoring 指标,请参阅自定义指标

  • 要使用 Monitoring API,请参阅 API 参考

  • 如需详细了解 Stackdriver Logging 及其与 Stackdriver Monitoring 的关系,请参阅 Logging

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
Stackdriver Monitoring
需要帮助?请访问我们的支持页面