选择虚拟机机器类型

本页将介绍为 Cloud Datalab 虚拟机 (VM) 实例选择适当的 Google Compute Engine 机器类型的注意事项。

选择虚拟机机器类型时的注意事项

在创建 Datalab 虚拟机实例时,您可以指定 Google Compute Engine 机器类型。所使用的默认机器类型是 n1-standard-1。您可以根据性能和成本特性选择其他机器类型来满足您的数据分析需求。以下是选择机器类型时的几个关键注意事项:

  • 每个笔记本都使用 Python 内核在其自己的进程中运行代码。例如,如果您打开了 N 个笔记本,则至少有 N 个进程与这些笔记本相对应。
  • 每个内核都是单线程的。除非同时运行多个笔记本,否则多个核心可能无法提供显著优势。
  • 根据您的使用模式和处理的数据量,选择具有额外内存的机器可能会对您大有益处。
  • 执行的结果是累积式的。运行某一行中的三个 Cloud Datalab 笔记本单元会导致相应状态的累积,包括为这些单元中所使用的数据结构分配的内存。
  • 在内存中处理大量数据(例如,使用 Pandas Dataframes)会让内存按比例分配。笔记本运行完毕后,您可以通过点击顶部栏中的“正在运行的会话”(Running Sessions) 图标 sessions-icon(您可能需要调整浏览器窗口的大小才能看到该图标)并关停会话来停止该会话。
  • Cloud Datalab 利用基于磁盘的 swap 文件来为额外的内存需求提供开销,但依赖于 swap 文件可能会降低处理速度。最佳方法是先估计内存需求,然后再选择一种至少具有估计所需内存大小的机器类型。

选择机器类型

创建实例时,您可以为自己的 Cloud Datalab 虚拟机实例选择一种机器类型。如需了解详情,请参阅 datalab create --machine-type。示例如下:

datalab create --machine-type n1-highmem-2 instance-name

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
Cloud Datalab 文档