Ray on Vertex AI 概览

Ray 是用于扩缩 AI 和 Python 应用的开源框架。Ray 为您的基础架构提供用于机器学习 (ML) 工作流的分布式计算和并行处理。

Ray 和 Vertex AI 比较

如果您已经在使用 Ray,则可以使用相同的开源 Ray 代码在 Vertex AI 上编写程序和开发应用,并且只需极少的更改。然后,您可以在机器学习工作流中使用 Vertex AI 与其他 Google Cloud 服务(例如 Vertex AI 预测BigQuery)的集成。

如果您已使用 Vertex AI 并需要一种更简单的方法来扩缩计算资源,您可以使用 Ray 代码优化训练、超参数调优、预测和在线传送步骤的性能。

在 Vertex AI 上使用 Ray 的工作流

在 Vertex AI 上使用 Ray 的过程如下:

步骤 说明
1. 为 Ray on Vertex AI 设置 设置您的 Google 项目,安装包含 Ray 客户端功能的 Python 版 Vertex AI SDK 版本,并设置 VPC 对等互连网络。
2. 在 Vertex AI 上创建 Ray 集群 在 Vertex AI 上创建 Ray 集群。
3. 在 Vertex AI 上开发 Ray 应用 连接到 Vertex AI 上的 Ray 集群并开发应用。
4.(可选)在 Vertex AI 上将 Ray 与 BigQuery 搭配使用 使用 BigQuery 读取、写入和转换数据。
5. (可选)在 Vertex AI 上部署模型并获取预测 将模型部署到 Vertex AI 在线端点并获取预测结果。
6. 查看 Vertex AI 上的 Ray 集群的日志 在 Cloud Logging 中查看生成的日志。
7. 删除 Vertex AI 上的 Ray 集群 删除 Vertex AI 上的 Ray 集群以避免不必要的计费。

架构

下图展示了设置 Google Cloud 项目和 VPC 网络后 Ray on Vertex AI 的架构和工作流:

Ray on Vertex AI 架构

  1. 使用以下方法在 Vertex AI 上创建 Ray 集群:

    1a. 使用控制台在 Vertex AI 上创建 Ray 集群。

    1b. 使用 Python 版 Vertex AI SDK 在 Vertex AI 上创建 Ray 集群。

  2. 使用以下方法通过 VPC 对等互连网络连接到 Vertex AI 上的 Ray 集群:

    2a. 在控制台中使用 Colab Enterprise。

    2b. 使用 Vertex AI Workbench 笔记本。

  3. 使用以下方法在 Vertex AI 上的 Ray 集群中开发应用并训练模型:

    • 在您的首选环境(Colab Enterprise 或 Vertex AI Workbench 笔记本)中使用 Python 版 Vertex AI SDK。

    • 使用您偏好的环境编写 Python 脚本。使用 Python 版 Vertex AI SDK、Ray Job CLI 或 Ray 信息中心将 Ray 作业提交到 Vertex AI 上的 Ray 集群。

  4. 将经过训练的模型部署到在线 Vertex AI 端点以进行预测。

  5. 使用 BigQuery 管理您的数据。

价格

Ray on Vertex AI 的价格按以下方式计算:

  • 系统会根据您在 Vertex AI 上创建 Ray 集群时选择的机器配置对您使用的计算资源收费。在预览版期间,Ray on Vertex AI 按照与自定义训练模型相同的费率收费。正式版 (GA) 发布后,价格会上涨,以反映 Ray on Vertex AI 价格。当 Ray on Vertex AI 正式发布时,您会收到价格变更通知。

  • 当您使用 Vertex AI 上的 Ray 集群执行任务时,系统会自动生成日志并根据 Cloud Logging 价格收取费用。

  • 如果您将模型部署到端点以进行在线预测,请参阅 Vertex AI 价格页面的“预测和说明”部分。

  • 如果您将 BigQuery 与 Ray on Vertex AI 搭配使用,请参阅 BigQuery 价格

后续步骤