选择笔记本解决方案

本页面介绍了 Vertex AI 的笔记本环境选项之间的差异,可协助您为项目选择最佳选项。

Vertex AI 提供两种笔记本环境解决方案:

  • Colab Enterprise:具有 Google Cloud 安全与合规性功能的代管式协作笔记本环境。如果项目的首要任务是与他人协作并避免花费时间来管理基础架构,那么 Colab Enterprise 可能是您的最佳选择。请参阅以下 Colab Enterprise 部分。

  • Vertex AI Workbench:通过虚拟机实例提供的基于 Jupyter 笔记本的环境,其功能支持整个数据科学工作流。如果项目的首要任务是控制和可自定义性,那么 Vertex AI Workbench 可能是您的最佳选择。请参阅以下 Vertex AI Workbench 部分。

Colab Enterprise

在后续各部分中了解 Colab Enterprise 的一些优势。如需了解详情,请参阅 Colab Enterprise 简介

共享和协作

利用 Colab Enterprise,可以共享笔记本并与他人协作。您可以与单个用户、Google 群组或 Google Workspace 网域共享笔记本。您可以通过 Identity and Access Management (IAM) 控制此访问权限。

代管式计算

利用 Colab Enterprise,可以在笔记本中工作,而无需管理基础架构。Colab Enterprise 会在您需要时为您预配运行时。如果需要,您可以根据特定需求配置运行时,但 Colab Enterprise 会为您启动运行时,如果您不再需要运行时,则会为您关停。

集成到 Google Cloud 控制台中

Colab Enterprise 与 Google Cloud 服务集成,可让您更轻松地使用与这些服务交互的笔记本。您可以在 Google Cloud 控制台中使用 Colab Enterprise,并且 Vertex AI 和 BigQuery 中都内置了该功能。

内嵌代码补全

利用 Vertex AI,您可以使用内嵌代码补全功能编写代码。使用代码补全建议更快地完成编码项目。如需了解详情,请参阅使用内嵌代码补全功能编写代码

Vertex AI Workbench

在后续各部分中了解 Vertex AI Workbench 的一些优势。如需了解详情,请参阅 Vertex AI Workbench 简介

实例类型

Vertex AI Workbench 为您的数据科学工作流提供了多个基于 Jupyter 笔记本的实例类型:

  • Vertex AI Workbench 实例:此选项将代管式笔记本实例的面向工作流的集成与用户管理的笔记本实例的可自定义性相结合。

  • Vertex AI Workbench 托管式笔记本已弃用):Google 托管的环境,该环境具有的集成和功能可帮助您在基于笔记本的端到端生产环境中进行设置和工作。

  • Vertex AI Workbench 用户管理的笔记本已弃用):可高度自定义的 Deep Learning VM Image 实例,因此非常适合对环境掌控需求较大的用户。

所有 Vertex AI Workbench 选项都提供以下功能:

  • 使用 JupyterLab 预封装。
  • 预装的深度学习软件包套件,包括 TensorFlow 和 PyTorch 框架支持。
  • 支持 GPU 加速器。
  • 能够与 GitHub 代码库同步。
  • Google Cloud 身份验证和授权。

Vertex AI Workbench 实例

如果您需要代管式笔记本的工作流集成以及用户管理的笔记本的自定义功能,Vertex AI Workbench 实例可能是一个不错的选择。

添加 conda 环境

Vertex AI Workbench 实例使用基于 conda 环境的内核。您可以将 conda 环境添加到 Vertex AI Workbench 实例,该环境在实例的 JupyterLab 界面中显示为内核。

添加 conda 环境后,您便可以使用默认的 Vertex AI Workbench 实例中没有的内核。例如,您可以为 R 和 Apache Beam 添加 conda 环境。或者,您可以为特定旧版可用框架(例如 TensorFlow、PyTorch 或 Python)添加 conda 环境。

如需了解详情,请参阅添加 conda 环境

数据的访问权限

您无需离开 JupyterLab 界面即可访问数据,从而提高工作效率。

在 Vertex AI Workbench 实例上的 JupyterLab 导航菜单中,您可以使用 Cloud Storage 集成来浏览您有权访问的数据和其他文件。

此外,您还可以在导航菜单中使用 BigQuery 集成来浏览您有权访问的表、写入查询、预览结果以及将数据加载到笔记本中。

自动运行笔记本

您可以将笔记本设置为定期运行。即使您的实例已关停,Vertex AI Workbench 也会运行您的笔记本文件并保存结果以供您查看并与他人分享。

空闲实例自动关停

为帮助管理费用,您可以将 Vertex AI Workbench 实例设置为在空闲一段时间后关停。如需了解详情,请参阅空闲机器关停

健康状况监控

为帮助确保您的 Vertex AI Workbench 实例正常运行,您可以监控健康状况

可修改的 Deep Learning VM 实例

Vertex AI Workbench 提供可通过 Notebooks API 修改底层虚拟机的 API 方法。

Vertex AI Workbench 代管式笔记本

如果要使用笔记本进行数据探索、分析、建模,或作为端到端数据科学工作流的一部分,代管式笔记本通常是不错的选择。

使用代管式笔记本实例,您无需离开 JupyterLab 界面即可执行面向工作流的任务。它们还具有许多用于实现数据科学工作流的集成和功能。

以下是代管式笔记本中包含的一些集成和功能。

通过 JupyterLab 控制硬件和框架

在代管式笔记本实例中,您通过 JupyterLab 界面指定用于运行代码的计算资源,例如,vCPU 或 GPU 数量、RAM 大小以及您希望代码在其中运行的框架。您可以先编写代码,然后在不离开 JupyterLab 或不重启实例的情况下选择如何运行代码。为了快速测试代码,您可以缩减硬件,然后在需要对更多数据运行代码时再进行扩容。

自定义容器

您的代管式笔记本实例提供许多常见的数据科学框架供您选择,例如 TensorFlow 和 PyTorch,但您也可以向实例添加自定义的 Docker 容器映像。 您的自定义容器在实例的 JupyterLab 界面中显示为内核。

如需了解详情,请参阅将自定义容器添加到代管式笔记本实例

数据的访问权限

您无需离开 JupyterLab 界面即可访问数据。

在代管式笔记本实例上的 JupyterLab 导航菜单中,您可以使用 Cloud Storage 集成来浏览您有权访问的数据和其他文件。

此外,您还可以在导航菜单中使用 BigQuery 集成来浏览您有权访问的表、写入查询、预览结果以及将数据加载到笔记本中。

自动运行笔记本

您可以将笔记本设置为定期运行。即使您的实例已关停,Vertex AI Workbench 也会运行您的笔记本文件并保存结果以供您查看并与他人分享。

Dataproc 集成

您可以通过在 Dataproc 集群上运行笔记本来快速处理数据。设置集群后,您可以在不离开 JupyterLab 界面的情况下在集群中运行笔记本文件。

空闲实例自动关停

为帮助管理费用,您可以将代管式笔记本实例设置为在空闲一段时间后关停。 如需了解详情,请参阅空闲机器关停

Vertex AI Workbench 用户管理的笔记本

如果用户需要进行大量自定义或对环境的掌控需求较高,则用户管理的笔记本是一个不错的选择。

可自定义的 Deep Learning VM 实例

用户管理的笔记本实例是 Deep Learning VM 实例。创建用户管理的笔记本实例时,您可以选择有关虚拟机 (VM) 实例的特定详细信息。例如,您可以在创建用户管理的笔记本实例时选择机器类型和框架。您可以在创建实例后更改其机器类型,但这需要重启实例。

在用户管理的笔记本实例上,您可以进行手动修改,例如更新软件和软件包版本。在实例上更改框架是一个更为复杂的过程。

由于用户管理的笔记本实例是作为 Compute Engine 实例公开的,因此您可以采用与自定义 Compute Engine 实例相同的方式对其进行自定义。 如需了解详情,请参阅 Compute Engine 文档

网络和安全

对于有特定网络和安全需求的用户,用户管理的笔记本是最佳选择。

用户管理的笔记本和代管式笔记本都支持 VPC Service Controls,但您可以更好地控制用户管理的笔记本实例的虚拟机。这可让您更轻松地手动配置用户管理的笔记本实例,以满足某些特定的网络和安全需求。

健康状况监控

为帮助确保用户管理的笔记本实例正常运行,您可以监控健康状况

后续步骤

首先,请创建以下其中一项: