Ray 是用于扩缩 AI 和 Python 应用的开源框架。Ray 为您的基础架构提供用于机器学习 (ML) 工作流的分布式计算和并行处理。
如果您已经在使用 Ray,则可以使用相同的开源 Ray 代码在 Vertex AI 上编写程序和开发应用,并且只需极少的更改。然后,您可以在机器学习工作流中使用 Vertex AI 与其他 Google Cloud 服务(例如 Vertex AI 预测和 BigQuery)的集成。
如果您已使用 Vertex AI 并需要一种更简单的方法来扩缩计算资源,您可以使用 Ray 代码优化训练、超参数调优、预测和在线传送步骤的性能。
在 Vertex AI 上使用 Ray 的工作流
在 Vertex AI 上使用 Ray 的过程如下:
步骤 | 说明 |
---|---|
1. 为 Ray on Vertex AI 设置 | 设置您的 Google 项目,安装包含 Ray 客户端功能的 Python 版 Vertex AI SDK 版本,并设置 VPC 对等互连网络。 |
2. 在 Vertex AI 上创建 Ray 集群 | 在 Vertex AI 上创建 Ray 集群。 |
3. 在 Vertex AI 上开发 Ray 应用 | 连接到 Vertex AI 上的 Ray 集群并开发应用。 |
4.(可选)在 Vertex AI 上将 Ray 与 BigQuery 搭配使用 | 使用 BigQuery 读取、写入和转换数据。 |
5. (可选)在 Vertex AI 上部署模型并获取预测 | 将模型部署到 Vertex AI 在线端点并获取预测结果。 |
6. 查看 Vertex AI 上的 Ray 集群的日志 | 在 Cloud Logging 中查看生成的日志。 |
7. 删除 Vertex AI 上的 Ray 集群 | 删除 Vertex AI 上的 Ray 集群以避免不必要的计费。 |
架构
下图展示了设置 Google Cloud 项目和 VPC 网络后 Ray on Vertex AI 的架构和工作流:
使用以下方法在 Vertex AI 上创建 Ray 集群:
1a. 使用控制台在 Vertex AI 上创建 Ray 集群。
1b. 使用 Python 版 Vertex AI SDK 在 Vertex AI 上创建 Ray 集群。
使用以下方法通过 VPC 对等互连网络连接到 Vertex AI 上的 Ray 集群:
2a. 在控制台中使用 Colab Enterprise。
2b. 使用 Vertex AI Workbench 笔记本。
使用以下方法在 Vertex AI 上的 Ray 集群中开发应用并训练模型:
在您的首选环境(Colab Enterprise 或 Vertex AI Workbench 笔记本)中使用 Python 版 Vertex AI SDK。
使用您偏好的环境编写 Python 脚本。使用 Python 版 Vertex AI SDK、Ray Job CLI 或 Ray 信息中心将 Ray 作业提交到 Vertex AI 上的 Ray 集群。
将经过训练的模型部署到在线 Vertex AI 端点以进行预测。
使用 BigQuery 管理您的数据。
价格
Ray on Vertex AI 的价格按以下方式计算:
系统会根据您在 Vertex AI 上创建 Ray 集群时选择的机器配置对您使用的计算资源收费。在预览版期间,Ray on Vertex AI 按照与自定义训练模型相同的费率收费。正式版 (GA) 发布后,价格会上涨,以反映 Ray on Vertex AI 价格。当 Ray on Vertex AI 正式发布时,您会收到价格变更通知。
当您使用 Vertex AI 上的 Ray 集群执行任务时,系统会自动生成日志并根据 Cloud Logging 价格收取费用。
如果您将模型部署到端点以进行在线预测,请参阅 Vertex AI 价格页面的“预测和说明”部分。
如果您将 BigQuery 与 Ray on Vertex AI 搭配使用,请参阅 BigQuery 价格。