本文档包含在 Google Cloud上运行生成式 AI 工作负载时使用 Artifact Registry 的最佳实践和指南。将 Artifact Registry 与 Vertex AI 搭配使用,可简化机器学习 (ML) 开发和部署流程,提高协作效率,并确保 ML 模型的安全性和可靠性。
以下是将 Artifact Registry 与 Vertex AI 搭配使用的应用场景:
- 管理机器学习制品:借助 Artifact Registry,您可以将所有机器学习制品(包括模型训练代码、数据集、训练后的模型和预测服务容器)集中存储和管理。您可以使用此集中式代码库在不同团队和项目之间跟踪、共享和重复使用机器学习制品。
- 版本控制和可重现性:Artifact Registry 为您的机器学习制品提供版本控制,帮助您跟踪更改并在需要时回滚到之前的版本。此功能对于确保机器学习实验和部署的可重现性至关重要。
- 安全可靠的存储空间:Artifact Registry 为您的机器学习制品提供安全可靠的存储空间。这些制品在静态和传输状态下均会加密。配置访问权限控制,以限制谁可以访问制品,从而帮助保护您的宝贵数据和知识产权。
- 与 Vertex AI Pipelines 集成:将 Artifact Registry 与 Vertex AI Pipelines 集成,以构建和自动执行机器学习工作流。使用 Artifact Registry 存储流水线制品(例如流水线定义、代码和数据),并在上传新制品时自动触发流水线运行。
- 简化机器学习的 CI/CD:将 Artifact Registry 与 CI/CD 工具集成,以简化机器学习模型的开发和部署。例如,每当您将新版本的模型推送到 Artifact Registry 时,使用 Artifact Registry 自动构建和部署模型服务容器。
- 支持多区域:借助 Artifact Registry,您可以将制品存储在多个区域中,这有助于提高机器学习模型的性能和可用性,尤其是在您的用户分布在全球各地的情况下。
必需的 Artifact Registry 控制措施
使用 Artifact Registry 时,强烈建议您采取以下控制措施。
为制品配置漏洞扫描
| Google 控制 ID | AR-CO-6.2 |
|---|---|
| 类别 | 必需 |
| 说明 | 使用 Artifact Analysis 或其他工具扫描 Artifact Registry 中的映像和软件包是否存在漏洞。 如果您使用第三方扫描工具,则必须正确部署这些工具,以便扫描 Artifact Registry 中的映像和软件包是否存在漏洞。 |
| 适用的产品 |
|
| 路径 | serviceusage.getservice |
| 运算符 | = |
| 值 |
|
| 相关 NIST-800-53 控制措施 |
|
| 相关 CRI 配置文件控制 |
|
| 相关信息 |
基于生成式 AI 应用场景的推荐控制措施
如果您处理敏感数据或敏感的生成式 AI 工作负载,建议您在适用的生成式 AI 使用场景中实施以下控制措施。
为制品创建清理政策
| Google 控制 ID | AR-CO-6.1 |
|---|---|
| 类别 | 根据使用情形推荐 |
| 说明 | 如果您存储了许多版本的制品,但只需要保留发布到正式版的特定版本,那么清理政策会很有用。创建单独的清理政策,用于删除制品和保留制品。 |
| 适用的产品 |
|
| 相关 NIST-800-53 控制措施 |
|
| 相关 CRI 配置文件控制 |
|
| 相关信息 |