Hello 图片数据:创建图片分类数据集并导入图片

使用 Google Cloud 控制台来创建图片分类数据集。创建数据集后,使用指向公共 Cloud Storage 存储桶中的图片的 CSV 将这些图片导入数据集。

本教程包含多个页面:

  1. 设置您的项目和环境。

  2. 创建图片分类数据集并导入图片。

  3. 训练 AutoML 图片分类模型。

  4. 评估和分析模型性能。

  5. 将模型部署到端点并发送预测。

  6. 清理您的项目。

每个页面均假定您已经按照本教程中之前页面的说明操作。

图片数据输入文件

您在本教程中使用的图片文件来自此 Tensorflow 博文中使用的花卉数据集。这些输入图片存储在公共 Cloud Storage 存储桶中。此可公开访问的存储桶还包含用于数据导入的 CSV 文件。 此文件有两列:第一列列出 Cloud Storage 中的图片 URI,第二列包含图片的标签。以下是一些示例行:

gs://cloud-samples-data/ai-platform/flowers/flowers.csv

gs://cloud-samples-data/ai-platform/flowers/daisy/10559679065_50d2b16f6d.jpg,daisy
gs://cloud-samples-data/ai-platform/flowers/dandelion/10828951106_c3cd47983f.jpg,dandelion
gs://cloud-samples-data/ai-platform/flowers/roses/14312910041_b747240d56_n.jpg,roses
gs://cloud-samples-data/ai-platform/flowers/sunflowers/127192624_afa3d9cb84.jpg,sunflowers
gs://cloud-samples-data/ai-platform/flowers/tulips/13979098645_50b9eebc02_n.jpg,tulips

创建图片分类数据集并导入数据

访问 Google Cloud 控制台,开始创建数据集并训练图片分类模型的过程。

收到提示时,请务必选择用于您的 Cloud Storage 存储分区的项目。

  1. 在“Vertex AI 使用入门”页面中,点击创建数据集

    Vertex AI 信息中心

  2. 为此数据集指定名称(可选)。

  3. 在“选择数据类型和目标”部分的“图片”标签页中,选择图片分类(单标签)单选选项。在“区域”下拉菜单中,选择美国中部

    新建数据集窗口

  4. 选择创建以创建空数据集。选择“创建”后,您将进入数据导入窗口。

  5. 选择 从 Cloud Storage 中选择导入文件,然后指定包含图片位置和标签数据的 CSV 文件的 Cloud Storage URI。在本快速入门中,该 CSV 文件位于 gs://cloud-samples-data/ai-platform/flowers/flowers.csv。将以下内容复制并粘贴到“导入文件路径”字段中:

    • cloud-samples-data/ai-platform/flowers/flowers.csv

    选择文件导入窗口

  6. 点击继续以开始导入图片。导入过程需要几分钟时间。完成后,您将进入下一页,该页面显示了为数据集识别出的所有图片(包括已标记图片和未标记的图片)。

后续步骤

按照本教程的下一页启动 AutoML 模型训练。