AI Platform 数据标签服务是云端数据处理附录中规定的 Google 义务所涵盖的一项服务。
AI Platform Data Labeling Service 可让您与人类贴标机协同工作,为可在机器学习模型中使用的数据集生成高精度标签。
为训练数据添加标签是机器学习开发周期的第一步。要训练机器学习模型,请提供要分类或分析的代表性数据样本,以及用于处理每个样本的机器学习算法。例如,要训练可识别图片中的鲜花的模型,您必须在图片数据集中为对象(如向日葵、玫瑰和郁金香)添加标签。要训练能够识别医疗文档中的疾病名称的模型,您必须在文档数据集中突出显示与疾病相关的字词。
要在 AI Platform Data Labeling Service 中开始为数据加标签,请为人工标签添加者创建以下三种资源:
- 数据集,其中包含要添加标签的代表性数据样本
- 标签集,其中列出了数据集中所有可能的标签。
- 一组说明instructions,用于指导人工标签添加者执行标签添加任务。
创建这些资源后,您可以将其作为标签请求的一部分提交。人工标签添加者会根据您的说明开始对数据集中的项目添加注释。人工标签添加者完成加标签任务后,您就可以导出已正确添加标签的数据集并在机器学习开发中使用它们