Hello 文本数据:创建文本分类数据集并导入文档
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
使用 Vertex AI 控制台创建文本分类数据集。创建数据集后,利用复制到 Cloud Storage 存储桶的 CSV 将这些文档导入数据集。
本教程包含多个页面:
设置项目和环境。
创建文本分类数据集。
训练 AutoML 文本分类模型。
将模型部署到端点并发送预测。
清理项目。
每个页面均假定您已经按照本教程中之前页面的说明操作。
转到 Vertex AI 控制台。
在 Vertex AI 使用入门页面中,点击创建数据集。
指定数据集的详细信息。
指定此数据集的名称,例如 text_classification_tutorial
。
在选择数据类型和目标部分,点击文本,然后选择文本分类(单标签)。
对于区域,选择 us-central1。
本教程使用 us-central1
,但 Vertex AI 支持其他区域,例如 europe-west4
。
点击创建以创建空数据集,然后导入文档。
在导入页面上,选择 radio_button_checked从 Cloud Storage 中选择一个导入文件,然后指定 CSV 文件的 Cloud Storage 位置。提示:点击浏览,在选择对象对话框中选择 happiness.csv
文件,然后点击选择。
在本教程中,CSV 文件的位置为:gs://${BUCKET}/text/happiness.csv
。本教程中的存储桶与数据集位于同一区域,但您可以指定位于任何区域的存储桶中的文件。
保留默认数据分块。
Vertex AI 会自动将文档分配到训练集、验证集和测试集。如需了解详情,请参阅 AutoML 模型的数据拆分简介。
点击继续以开始导入。
导入过程需要几分钟才能完成。导入完成后,您可以在数据集的浏览标签页中浏览所有导入的文档及其关联标签。
后续步骤
按照本教程的下一页启动 AutoML 模型训练。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-02-14。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-02-14。"],[],[]]