使用 AutoML Vision 为图片加标签
本快速入门将引导您完成以下过程:
- 将一组图片复制到 Cloud Storage 中。
- 创建一个列有图片及其分类标签的 CSV 文件。
- 使用 AutoML Vision 创建数据集,并训练和部署模型。
- 使用通过自定义标签训练的模型对图片进行分类。
准备工作
设置项目
- 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
- 安装 Google Cloud CLI。
-
如需初始化 gcloud CLI,请运行以下命令:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Enable the AutoML and Cloud Storage APIs:
gcloud services enable storage-component.googleapis.com
automl.googleapis.com storage-api.googleapis.com - 安装 Google Cloud CLI。
-
如需初始化 gcloud CLI,请运行以下命令:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Enable the AutoML and Cloud Storage APIs:
gcloud services enable storage-component.googleapis.com
automl.googleapis.com storage-api.googleapis.com - 将
PROJECT_ID
环境变量设置为项目 ID。export PROJECT_ID=PROJECT_ID
AutoML API 调用和资源名称中包含您的项目 ID。PROJECT_ID
环境变量提供了一种指定此 ID 的便捷方式。
创建 Cloud Storage 存储桶
使用 Cloud Shell(一个连接到 Google Cloud 控制台项目的基于浏览器的 Linux 命令行)创建 Cloud Storage 存储桶:
创建 Cloud Storage 存储分区。 存储分区名称必须采用以下格式:
project-id-vcm
.以下命令将在
us-central1
地区中创建一个名为project-id-vcm
的存储桶。 如需查看可用区域的完整列表,请参阅“存储桶位置”页面。gsutil mb -p ${PROJECT_ID} -c regional -l us-central1 gs://${PROJECT_ID}-vcm/
设置 BUCKET 变量。
export BUCKET=${PROJECT_ID}-vcm
将示例图片复制到存储桶中
接下来,复制此 Tensorflow 博文中使用的花卉数据集。 这些图片存储在公共 Cloud Storage 存储桶中,因此您可以直接将它们从该公共存储桶复制到自己的存储桶。
在 Cloud Shell 会话中,输入以下内容:
gsutil -m cp -R gs://cloud-samples-data/ai-platform/flowers/ gs://${BUCKET}/img/
文件复制操作需要大约 20 分钟才能完成。
创建图片分类 CSV 文件
样本数据集包含一个 CSV 文件,其中包含每张图片的位置和标签。您将基于这一文件创建您自己的 CSV 文件:
更新 CSV 文件,使其指向您自己的存储桶中的文件:
gsutil cat gs://${BUCKET}/img/flowers/all_data.csv | sed "s:cloud-ml-data/img/flower_photos/:${BUCKET}/img/flowers/:" > all_data.csv
将 CSV 文件复制到您的存储桶中:
gsutil cp all_data.csv gs://${BUCKET}/csv/
创建图片分类数据集
访问 AutoML Vision 界面,开始创建数据集并训练模型。
收到提示时,请务必选择用于您的 Cloud Storage 存储桶的项目。
在 AutoML Vision 页面中,点击新建数据集:
为此数据集指定名称。点击加号 (+) 继续。
在选择要导入的文件屏幕中,选择
选择 Cloud Storage 上的 CSV 文件单选选项。指定 CSV 文件的 Cloud Storage URI。在本快速入门中,CSV 文件的位置为:gs://${PROJECT_ID}-vcm/csv/all_data.csv
将
PROJECT_ID
替换为您的特定项目 ID。点击继续以开始导入图片。导入过程需要几分钟时间。完成后,您将会被引导至下一页面,其中包含为数据集识别出的所有图片(包括已添加标签和未添加标签的图片)的详细信息。
训练云托管 AutoML Vision 模型
创建数据集并完成相应处理后,选择训练标签页可开始训练模型。
选择开始训练以继续。这将打开一个训练新模型窗口,其中包含训练选项。
在新模型训练窗口的定义模型部分中,更改模型名称(可选)并选择
云托管模型单选选项。选择继续以转到下一部分。在设置节点时预算部分中,接受建议的节点预算(32 个节点时)。
选择开始训练以开始训练模型。
系统将针对您的模型开始训练,训练时间大约为一小时。 训练可能会在达到您选择的节点时之前停止。该服务将在训练完成后或发生任何错误时通过电子邮件通知您。
部署 AutoML Vision 分类模型
成功训练自定义模型后,您可以使用它来为图片添加标签。 选择测试和使用标签页。
如果您没有选择启用自动部署,则系统会提示您先部署模型,然后才能进行预测。
使用 AutoML Vision 模型给图片加标签
点击预测标签页,了解如何将图片发送到模型以获取图片内容标签。您还可以参阅进行在线预测或进行批量预测以查看示例。
清理
为避免因本页面中使用的资源导致您的 Google Cloud 账号产生费用,请删除包含这些资源的 Google Cloud 项目。
如果您不再需要您的自定义模型或数据集,可以将其删除。
为避免产生不必要的 Google Cloud Platform 费用,请使用 GCP Console 删除您不需要的项目。
取消部署模型
模型部署后即会产生费用。
- 选择标题栏正下方的测试和使用标签页。
- 从模型名称下方的横幅中选择移除部署,以打开取消部署选项窗口。
- 选择移除部署以取消部署模型。
- 模型取消部署完成后,您会收到电子邮件通知。
删除项目(可选)
为避免产生不必要的 Google Cloud Platform 费用,请使用 Google Cloud 控制台删除您不需要的项目。
后续步骤
- 如需详细了解机器学习 (ML),请参阅新手指南。
- 如需了解机器学习公平性,请参阅包容性机器学习指南 - AutoML。
- 按照 Edge 设备模型快速入门训练可导出的 AutoML Vision Edge 模型。
- 借助 AutoML API 客户端库,以您选择的语言开始使用 AutoML API。
- 通过方法指南详细了解特定资源的创建和管理(例如数据集和模型),或如何获取单个图片或批量图片的注释。
- 完成其中一个教程。