Datalab 快速入门

本快速入门介绍如何设置 Datalab 以用于 Cloud Monitoring 项目。利用 Datalab 的动态笔记本,您可以执行临时分析和可视化,而这些功能是 Monitoring 当前无法提供的。

要在 Datalab 中预览 Monitoring 教程,请参阅 Monitoring 教程。您必须运行 Datalab,才能与该教程互动。

准备工作

  1. 登录您的 Google Cloud 帐号。如果您是 Google Cloud 新手,请创建一个帐号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  3. 确保您的 Cloud 项目已启用结算功能。 了解如何确认您的项目是否已启用结算功能

  4. 启用 Compute Engine and Cloud Source Repositories API。

    启用 API

  5. 安装并初始化 Cloud SDK

设置 Datalab

在本地机器上的终端窗口中执行以下步骤:

  1. 获取最新的 gcloud 命令:
    gcloud components update
    
  2. 安装 gcloud datalab 组件:
    gcloud components install datalab
    
  3. gcloud 配置为关联到您的 Google Cloud 项目 ID,在将 [PROJECT_ID] 替换为您的 Google Cloud 项目 ID 后,运行以下命令:

    gcloud config set project [PROJECT_ID]
    

    要验证配置,请运行以下命令:

    gcloud config get-value project
    

  4. 要创建 Datalab 实例,在将 [DATALAB-INSTANCE-NAME] 替换为实例名称后,运行以下命令。名称必须以小写字母开头,后面最多可跟 62 个小写字母、数字或连字符,但不能以连字符结尾:

    datalab create [DATALAB-INSTANCE-NAME]
    

    • 如果出现提示,请从列表中选择一个地区。
    • 如果系统要求您设置 SSH 密码,请输入一个词组。请务必保存此密码。
    • 片刻之后,系统将显示如下所示的消息。

      Created [https://www.googleapis.com/compute/v1/projects/[PROJECT_ID]/zones/[ZONE]/instances/[DATALAB-INSTANCE-NAME]].
      Connecting to [DATALAB-INSTANCE-NAME].
      This will create an SSH tunnel and may prompt you to create an rsa key pair. To manage these keys, see https://cloud.google.com/compute/docs/instances/adding-removing-ssh-keys
      Waiting for Datalab to be reachable at http://localhost:8081/
      

      如果出现提示,请输入您的密码:

      Enter passphrase for key '[...]/.ssh/google_compute_engine':
      

      几分钟后,create 命令会成功完成,系统将显示如下所示的消息。

      The connection to Datalab is now open and will remain until this command is killed.
      You can connect to Datalab at http://localhost:8081/
      

  5. datalab 命令处于活跃状态时,与 Datalab 实例的连接将保持打开状态。如果终端命令窗口关闭或中断,则连接将终止。 要重新建立连接,请运行以下命令:

    datalab connect [DATALAB-INSTANCE-NAME]
    

Datalab 界面

您执行 datalab connect 命令时,系统会打开一个浏览器窗口,其中网址设置为 http://127.0.0.1:8081/。此页面显示 Datalab 首页:

Datalab 界面

在 Datalab docs/ 文件夹中,您可以浏览多个 Datalab 使用入门笔记本,其中包括用于 Cloud Monitoring 的笔记本。

Monitoring 教程

Datalab 安装了多个 Monitoring 互动式教程:

开始
演示如何将 Python Google Cloud 的操作套件 API 导入 Datalab 以及如何设置默认 Google Cloud 项目 ID。同时提供示例代码调用 API 并从项目中检索监控数据。
群组指标
演示如何查看项目中的群组结构以及如何使用群组过滤和聚合指标数据。如需使用群组指标,您必须配置 Cloud Monitoring 群组。如需了解详情,请参阅使用资源组
发生时间偏移的数据
演示如何以一些有趣的方式转换时间序列数据。由于您的项目可能没有足够的虚拟机实例,起不到良好的示例作用,因此本教程设置为可以视情况使用以前从演示项目中提取的数据。

您可以运行教程,并视情况对其进行修改,具体如以下部分所述。

运行教程

要运行这些教程,请执行以下操作:

  1. 依次点击 Datalab 界面中的 docstutorialsStackdriver Monitoring。您应该能够看到以下页面:

    Stackdriver 教程

  2. 选择教程。点击您要运行的教程名称。

  3. 设置项目 ID:修改包含 set_datalab_project_id('my-project-id') 的单元,并将 my-project-id 替换为您的 Google Cloud 项目 ID。

  4. 运行教程代码。从界面顶部的菜单栏中,选择 Run > Run all cells。这将使用您当前的项目 ID 重新运行教程中的所有代码。

随意修改教程中的代码,试试这些更改会产生什么结果。 您可以通过点击一个单元并从该单元左侧的菜单中选择 Run 来运行单元中的代码。 您也可以创建自己的笔记本。

清理

为避免系统因本页中使用的资源向您的 Google Cloud 帐号收取费用,请按照以下步骤操作。

  1. 点击 Datalab 界面右上角的正在运行的会话图标,然后关闭所有未使用的笔记本。您可以在稍后需要时重启。 关闭关联的浏览器标签页或窗口。

  2. 在 Datalab 运行的窗口中输入 CTRL-C,并在浏览器中关闭 Datalab 标签。

  3. 从创建 Datalab 虚拟机实例到将其删除的这段时间里,您需要支付相关费用(请参阅 Cloud Datalab 价格)。您还需要为用来存储笔记本的永久性磁盘支付费用。 在您删除 Datalab 虚拟机之后,永久性磁盘仍将保留,直到您将其删除。

    要删除 Datalab 虚拟机实例及其永久性磁盘,请运行以下命令:

    datalab delete --delete-disk [DATALAB-INSTANCE-NAME]
    

  4. 存在通过 datalab create 命令创建的其他资源,这些资源可供您创建的其他 Datalab 实例重复使用。如果您不打算创建其他 Datalab 实例,可以运行以下这些命令来删除下面列出的其他资源:

    • 删除 datalab-network-allow-ssh 防火墙规则,该规则可让您通过 SSH 协议连接到自己的 Datalab 实例:
      gcloud compute firewall-rules delete datalab-network-allow-ssh
      
    • 删除 datalab-network Virtual Private Cloud (VPC) 网络,默认情况下 Datalab 实例均连接到该网络:
      gcloud compute networks delete datalab-network
      
    • 删除 datalab-notebooks Cloud Source Repositories 代码库,该代码库是为您存储笔记本而设置的(如果您想要在删除代码库前先备份笔记本,请参阅使用笔记本):
      gcloud source repos delete datalab-notebooks
      
  5. 如果您不想保留创建的任何虚拟机实例或项目,请将其移除。

后续步骤

请参阅以下 API 参考资料: