项目、模型、版本、作业

机器学习 (ML) 中的许多术语在不同语境下都有着不同的含义。 本部分定义了本文档中用到的一些术语。

项目、模型、版本、作业

项目
“项目”是指您的 Google Cloud 项目它是您部署的模型和作业的逻辑容器。您用于开发 AI Platform Training 解决方案的每个项目都必须启用 AI Platform Training。您的 Google 账号可以访问多个 Google Cloud 项目。
模型
在 ML 中,“模型”代表着您尝试解决的问题的解决方案。model换句话说,它是根据数据预测值的配方。 在 AI Platform Training 中,模型是这种解决方案各个版本的逻辑容器。例如,假设您要解决的问题是根据一组有关先前销售的数据预测房屋的销售价格。在 AI Platform Training 中创建一个名为 housing_prices 的模型,并尝试使用多种机器学习技术来解决问题。在每个阶段,您都可以部署该模型的版本。每个版本都可能与其他版本截然不同,但您可以将这些版本组织在同一模型下(只要这种做法适合您的工作流)。
经过训练的模型
“经过训练的模型”包括经过训练的计算模型的状态及其设置。
已保存的模型
大多数机器学习框架都可以序列化表示经过训练的模型的信息,并创建一个“已保存的模型”的文件,您可以将这个文件部署到云端进行预测。
模型版本
“模型版本”(或者简称为“版本”)是存储在 AI Platform Training 模型服务中的机器学习解决方案的实例。您通过将序列化且经过训练的模型(作为已保存的模型)传递给服务来创建版本。当您创建版本时,您还可以提供自定义代码(Beta 版)来处理预测。
作业
您可以通过发起“请求”和“作业”来与 AI Platform Training 的服务进行交互。“请求”即常规 Web API 请求,会尽快返回响应。“作业”是长时间运行的异步处理操作。AI Platform Training 提供训练作业和批量预测作业。您提交启动作业的请求并获得快速响应,以验证作业状态。随后,您可以定期请求状态以跟踪作业的进度。

打包、暂存、导出和部署模型

您可以移动模型和数据,尤其是在本地环境与 Cloud Storage 之间,以及 Cloud Storage 与 AI Platform Training 服务之间进行移动。本文档使用以下术语来表示该过程中的具体操作。

套餐
您将训练应用打包,以便 AI Platform Training 训练服务在各训练实例上安装该应用。通过打包应用,您可以将其打包为标准的 Python 分发软件包。部署用于预测的自定义代码(Beta 版)时,您还可以将处理预测的代码打包。
暂存
您在项目有权访问的一个 Cloud Storage 存储桶中暂存训练应用程序包。这让训练服务能够访问程序包,并将其复制到所有训练实例。 您还可以在项目有权访问的 Cloud Storage 存储分区内的其他位置暂存已保存的模型。这使在线预测服务能够访问并部署模型。如果您部署用于预测的自定义代码(Beta 版),则还要在 Cloud Storage 中暂存自定义代码包,以便在线预测服务可以在部署期间访问它。
导出
在机器学习模型的语境中,本文档使用导出来表示将计算模型和设置序列化为文件的过程。您可以使用已保存的模型和对象进行导出。
部署
您在创建版本资源时部署模型版本deploy。您可以指定导出的模型(已保存的模型目录)以及要为其分配该版本的模型资源,AI Platform Training 会托管该版本,以便您向其发送预测。如果您部署用于预测的自定义代码(Beta 版),则您可以在部署期间提供自定义代码包。

后续步骤