Hello 文本数据:创建文本分类数据集并导入文档

使用 Vertex AI 控制台创建文本分类数据集。创建数据集后,利用复制到 Cloud Storage 存储桶的 CSV 将这些文档导入数据集。

本教程包含多个页面:

  1. 设置项目和环境。

  2. 创建文本分类数据集。

  3. 训练 AutoML 文本分类模型。

  4. 将模型部署到端点并发送预测。

  5. 清理项目。

每个页面均假定您已经按照本教程中之前页面的说明操作。

  1. 转到 Vertex AI 控制台

  2. Vertex AI 使用入门页面中,点击创建数据集

  3. 指定数据集的详细信息。

    1. 指定此数据集的名称,例如 text_classification_tutorial

    2. 选择数据类型和目标部分,点击文本,然后选择文本分类(单标签)

    3. 对于区域,选择 us-central1

      本教程使用 us-central1,但 Vertex AI 支持其他区域,例如 europe-west4

    4. 点击创建以创建空数据集,然后导入文档。

  4. 在导入页面上,选择 从 Cloud Storage 中选择一个导入文件,然后指定 CSV 文件的 Cloud Storage 位置。提示:点击浏览,在选择对象对话框中选择 happiness.csv 文件,然后点击选择

    在本教程中,CSV 文件的位置为:gs://${BUCKET}/text/happiness.csv。本教程中的存储桶与数据集位于同一区域,但您可以指定位于任何区域的存储桶中的文件。

  5. 保留默认数据分块。

    Vertex AI 会自动将文档分配到训练集、验证集和测试集。如需了解详情,请参阅 AutoML 模型的数据拆分简介

  6. 点击继续以开始导入。

    导入过程需要几分钟才能完成。导入完成后,您可以在数据集的浏览标签页中浏览所有导入的文档及其关联标签。

后续步骤

按照本教程的下一页启动 AutoML 模型训练。