“通过界面创建 Cloud 模型”快速入门

本快速入门将引导您完成以下过程:

  • 创建带有标签的边界框的图片数据集。
  • 使用数据集训练自定义模型。

在此快速入门中,您可以使用自定义界面 (UI) 与 Cloud AutoML API 交互。您还可以使用 AutoML API 完成本快速入门中的所有步骤。如需查看关于如何使用界面或 API 的更多说明,请参阅方法指南

设置项目

在使用 AutoML Vision Object Detection 之前,您必须先创建 Google Cloud 项目(尚未用于其他任何 AutoML 产品的项目),然后为该项目启用 Cloud AutoML Vision Object Detection。

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. 在 Cloud Console 的项目选择器页面上,选择或创建 Cloud 项目。

    转到项目选择器页面

  3. 确保您的 Google Cloud 项目已启用结算功能。 了解如何确认您的项目已启用结算功能

  4. 启用 Cloud AutoML and Storage API。

    启用 API

Beta 版要求

  1. 此 Beta 版要求您使用 us-central1 作为指定区域。

准备数据集

在本快速入门中,您将使用通过 Open Images Dataset V4 创建的数据集。此公开可用的沙拉数据集位于 gs://cloud-ml-data/img/openimage/csv/salads_ml_use.csv

CSV 格式如下:

TRAIN,gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg,Salad,0.0,0.0954,,,0.977,0.957,,
    VALIDATE,gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg,Seafood,0.0154,0.1538,,,1.0,0.802,,
    TEST,gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg,Tomato,0.0,0.655,,,0.231,0.839,,
数据集图片示例
3916261642_0a504acd60_o.jpg

每行对应一个位于较大图片内的对象,每个对象专门指定为测试数据、训练数据或验证数据。此处包含的三行表示位于同一张图片 (gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg) 内的三个不同对象。除了具有 Baked goodsCheese 标签的其他行以外,这三行中的每一行具有不同的标签:SaladSeafoodTomato

我们使用左上顶点和右下顶点为每张图片指定边界框:

  • (0,0) 对应于左上角最远处的顶点。
  • (1,1) 对应于右下角最远处的顶点。

对于上面显示的第一行,具有 Salad 标签的对象的左上顶点的 (x, y) 坐标为 (0.0,0.0954),其右下顶点的坐标为 (0.977,0.957)。

如需详细了解如何设置 CSV 文件格式以及创建有效数据集的最低要求,请参阅准备训练数据


创建数据集并导入训练图片

  1. 打开 Cloud AutoML Vision Object Detection 界面,然后从标题栏的下拉列表中选择您的项目。

    首次打开 Cloud AutoML Vision Object Detection 界面时,如果尚未启用 AutoML API (Enable AutoML API),您需要启用它。

  2. 看到提示时,在弹出式窗口中选择开始

    选择“开始”选项

  3. 您将转到数据集列表页面。通过选择新建数据集来创建新数据集。

    选择“新建数据集”

    为您的数据集输入一个独一无二的名称。

    为新创建的数据集选择名称

  4. 在随后出现的窗口中输入要导入的训练数据的位置。

    选择 Cloud Storage 上的 CSV 文件文本框中,输入示例 CSV 文件的路径(系统会自动添加 gs:// 前缀):

    cloud-ml-data/img/openimage/csv/salads_ml_use.csv

    您也可以选择浏览,然后导航至某个 Google Cloud Storage 存储分区中的 CSV 文件。

    此快速入门使用暂存在公共 Google Cloud Storage 存储分区中的示例数据。训练数据是您希望模型学习识别的带边界框注释和对象标签的示例 JPG 图片。要将训练数据导入数据集,请使用指向图片(JPEG、PNG、GIF、BMP 或 ICO)文件的 CSV 文件;请参阅准备训练数据以了解有关格式和图片规格的信息。

    创建数据集上传 CSV 图片
  5. 选择导入

    您的数据集会在图片导入期间显示 Running:importing images状态。此过程只需几分钟时间。

成功导入训练数据后,状态列会显示 Success:Creating dataset,界面会显示为数据集生成的 ID(在调用 AutoML API 时使用)以及所导入的项数。

列出数据集图片

如果在导入图片时出现问题,您会看到 Warning: Importing images 的状态。选择数据集名称和详细信息可查看导入特定图片时出现的错误。

导入错误图片

训练模型

创建数据集并将训练数据导入数据集后,您可以训练自定义模型。

  1. 数据集列表页面中,点击数据集名称。

    列出数据集页面

  2. 选择训练标签页。此操作将显示所有标签及其训练集、测试集和验证集分类。

    训练选项包括训练集、测试集和验证集

  3. 选择开始训练,打开包含训练选项的侧边栏。

    训练面板

  4. 输入自定义模型的名称或接受默认名称。在此面板中,您还可以选择模型优化(针对延迟或准确率)。

    选中 训练完成后将模型部署到节点以选择启用自动部署。否则,系统将提示您在训练后手动部署模型,然后才能进行预测。

  5. 选择开始训练

    “开始模型训练”页面

训练模型可能需要几个小时才能完成。示例的训练时间通常约为 1 小时。

成功训练模型后,我们会向您注册程序时使用的电子邮件地址发送一封邮件。

评估自定义模型

训练完模型后,Cloud AutoML Vision Object Detection 会评估新模型的质量和准确率。要查看模型的评估指标,请执行以下操作:

  1. 打开 Cloud AutoML Vision Object Detection 界面,然后点击左侧导航栏中的模型标签页(带有灯泡图标)。

  2. 点击要评估的模型的名称。

  3. 如果需要,请点击标题栏正下方的评估标签页。

    如果模型训练完毕,Cloud AutoML Vision Object Detection 会显示其评估指标。它提供了模型整体及每个对象标签在不同得分和交并比 (IoU) 阈值时的精确率和召回率得分。 要查看特定对象标签的指标,请从“过滤条件标签”列表中选择该标签。

    模型评估页面

精确率召回率用于衡量模型捕获信息的情况以及丢失的信息量。精确率表示在使用特定标签注释的所有对象中,实际有多少对象应分配给该标签。召回率表示在应被确定为特定实体的所有对象中,实际有多少对象分配给了该实体。

您可利用这些数据来评估模型的就绪情况:

  • 低精确率或召回率得分可能表明您的模型需要额外的训练数据。
  • 完美的精确率和召回率可能表明数据过于简单,模型可能无法有效泛化。

使用自定义模型

成功训练模型后,您可以使用它来通过自定义模型识别带有边界框和标签的图片中的对象。选择测试和使用标签页。

如果您没有选择启用自动部署,则系统会提示您先部署模型,然后才能进行预测。

进行预测

模型部署完毕后,请在测试和使用页面上指示测试图片的路径(例如,保存在本地的此图片)。Cloud AutoML Vision Object Detection 使用模型分析图片,并在图片中显示带有标签的对象及其边界框。

“对上传的图片进行预测”页面

清理

如果您不再需要自己的自定义模型或数据集,可以将其删除。

为避免产生不必要的 Google Cloud Platform 费用,请使用 GCP Console 删除您不需要的项目。

取消部署模型

模型部署后即会产生费用。

  1. 选择标题栏正下方的测试和使用标签页。
  2. 从模型名称下方的横幅中选择移除部署,以打开取消部署选项窗口。

    取消部署弹出式菜单

  3. 选择移除部署以取消部署该模型。

    模型部署

  4. 模型取消部署完成后,您会收到电子邮件通知。

删除项目(可选)

为避免产生不必要的 Google Cloud Platform 费用,请使用 Cloud Console 删除您不需要的项目。