Datalab 快速入门

本快速入门介绍如何设置 Datalab 以用于 Cloud Monitoring 项目。利用 Datalab 的动态笔记本,您可以执行临时分析和可视化,而这些功能是 Monitoring 当前无法提供的。

要在 Datalab 中预览 Monitoring 教程,请参阅 Monitoring 教程。您必须运行 Datalab,才能与该教程互动。

准备工作

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. 在 Cloud Console 的项目选择器页面上,选择或创建 Cloud 项目。

    转到项目选择器页面

  3. 确保您的 Google Cloud 项目已启用结算功能。 了解如何确认您的项目已启用结算功能

  4. 启用 Compute Engine and Cloud Source Repositories API。

    启用 API

  5. 安装并初始化 Cloud SDK

设置 Datalab

在本地机器上的终端窗口中执行以下步骤:

  1. 获取最新的 gcloud 命令:
        gcloud components update
        
  2. 安装 gcloud datalab 组件:
        gcloud components install datalab
        
  3. gcloud 配置为关联到您的 Google Cloud 项目 ID,在将 [PROJECT_ID] 替换为您的 Google Cloud 项目 ID 后,运行以下命令:

        gcloud config set project [PROJECT_ID]
        

    要验证配置,请运行以下命令:

        gcloud config get-value project
        

  4. 要创建 Datalab 实例,在将 [DATALAB-INSTANCE-NAME] 替换为实例名称后,运行以下命令。名称必须以小写字母开头,后面最多可跟 62 个小写字母、数字或连字符,但不能以连字符结尾:

        datalab create [DATALAB-INSTANCE-NAME]
        

    • 如果出现提示,请从列表中选择一个地区。
    • 如果系统要求您设置 SSH 密码,请输入一个词组。请务必保存此密码。
    • 片刻之后,系统将显示如下所示的消息。

          Created [https://www.googleapis.com/compute/v1/projects/[PROJECT_ID]/zones/[ZONE]/instances/[DATALAB-INSTANCE-NAME]].
          Connecting to [DATALAB-INSTANCE-NAME].
          This will create an SSH tunnel and may prompt you to create an rsa key pair. To manage these keys, see https://cloud.google.com/compute/docs/instances/adding-removing-ssh-keys
          Waiting for Datalab to be reachable at http://localhost:8081/
          

      如果出现提示,请输入您的密码:

          Enter passphrase for key '[...]/.ssh/google_compute_engine':
          

      几分钟后,create 命令会成功完成,系统将显示如下所示的消息。

          The connection to Datalab is now open and will remain until this command is killed.
          You can connect to Datalab at http://localhost:8081/
          

  5. datalab 命令处于活动状态时,与 Datalab 实例的连接将保持打开状态。如果终端命令窗口关闭或中断,则连接将终止。要重新建立连接,请运行以下命令:

        datalab connect [DATALAB-INSTANCE-NAME]
        

Datalab 界面

要查看 Datalab 界面,请在浏览器中前往网址 http://127.0.0.1:8081/ 或点击以下按钮。如果您是第一次使用 Datalab,则需要同意服务条款。

转到正在运行的 Datalab

Datalab 界面

在 Datalab docs/ 文件夹中,您可以浏览多个 Datalab 使用入门笔记本,其中包括用于 Cloud Monitoring 的笔记本。

Datalab 和 Cloud Monitoring

Monitoring 使用工作区来整理一个或多个 Google Cloud 项目中包含的资源。借助工作区,您可以执行创建提醒和信息中心以及配置群组等操作。

您必须创建一个工作区才能将群组用于 Datalab。要创建工作区,请转到 Monitoring:

转到“监控”

如果您的 Google Cloud 项目已与工作区关联,则系统会显示 Cloud Monitoring 首页。否则,系统会自动创建工作区。一般情况下,此过程不需要您进行任何交互,但需要一些时间才能完成。在某些情况下,系统会显示将项目添加到工作区对话框。在这种情况下,选择用于创建新工作区的选项。如需了解详情,请参阅工作区

Monitoring 教程

Datalab 安装了多个 Monitoring 互动式教程:

开始
演示如何将 Python Google Cloud 的操作套件 API 导入 Datalab 以及如何设置默认 Google Cloud 项目 ID。同时提供示例代码调用 API 并从项目中检索监控数据。
群组指标
演示如何查看项目中的群组结构以及如何使用群组过滤和聚合指标数据。要使用群组指标,您必须拥有一个工作区。如果您的工作区没有群组,请改用另一个包含群组的工作区。如需了解详情,请参阅工作区
发生时间偏移的数据
演示如何以一些有趣的方式转换时间序列数据。由于您的项目可能没有足够的虚拟机实例,起不到良好的示例作用,因此本教程设置为可以视情况使用以前从演示项目中提取的数据。

您可以运行教程,并视情况对其进行修改,具体如以下部分所述。

运行教程

要运行这些教程,请执行以下操作:

  1. 依次点击 Datalab 界面中的 docstutorialsStackdriver Monitoring。您应该能够看到以下页面:

    Stackdriver 教程

  2. 选择教程。点击您要运行的教程名称。

  3. 设置项目 ID:按如下所示修改包含 set_datalab_project_id('my-project-id') 的单元:

    • 如果您创建了工作区,请将 my-project-id 替换为您的工作区名称。您必须拥有一个工作区才能使用群组指标。
    • 如果您没有工作区,请用您的 Google Cloud 项目 ID 替换 my-project-id
  4. 运行教程代码。从界面顶部的菜单栏中,选择Run > Run all cells。这将使用您当前的项目 ID 重新运行教程中的所有代码。

随意修改教程中的代码,试试这些更改会产生什么结果。 您可以通过点击一个单元并从该单元左侧的菜单中选择 Run 来运行单元中的代码。您也可以创建自己的笔记本。

清理

为避免系统因本快速入门中使用的资源向您的 Google Cloud 帐号收取费用,请按照以下步骤操作。

  1. 点击 Datalab 界面右上角的正在运行的会话图标,然后关闭所有未使用的笔记本。您可以在稍后需要时重启。 关闭关联的浏览器标签页或窗口。

  2. 在 Datalab 运行的窗口中输入 CTRL-C,并在浏览器中关闭 Datalab 标签。

  3. 从创建 Datalab 虚拟机实例到将其删除的这段时间里,您需要支付相关费用(请参阅 Cloud Datalab 价格)。您还需要为用来存储笔记本的永久性磁盘支付费用。 在您删除 Datalab 虚拟机之后,永久性磁盘仍将保留,直到您将其删除。

    要删除 Datalab 虚拟机实例及其永久性磁盘,请运行以下命令:

        datalab delete --delete-disk [DATALAB-INSTANCE-NAME]
        

  4. 存在通过 datalab create 命令创建的其他资源,这些资源可供您创建的其他 Datalab 实例重复使用。如果您不打算创建其他 Datalab 实例,可以运行以下这些命令来删除下面列出的其他资源:

    • 删除 datalab-network-allow-ssh 防火墙规则,该规则可让您通过 SSH 协议连接到自己的 Datalab 实例:
          gcloud compute firewall-rules delete datalab-network-allow-ssh
          
    • 删除 datalab-network Virtual Private Cloud (VPC) 网络。默认情况下 Datalab 实例均连接到该网络:
          gcloud compute networks delete datalab-network
          
    • 删除 datalab-notebooks Cloud Source Repositories 代码库,该代码库是为您存储笔记本而设置的(如果您想要在删除代码库前先备份笔记本,请参阅使用笔记本)。
          gcloud source repos delete datalab-notebooks
          
  5. 如果您不想保留创建的任何工作区、项目或虚拟机实例,请将其移除。

后续步骤

请参阅以下 API 参考资料: