常见问题解答 (FAQ)

谁将对我的数据添加标签?
根据 Google 的云端数据处理附录 (CDPA),有两家主要供应商正式加入我们的分包商队伍:即 GlobalLogic Technologies Ltd 和 Teleperformance Global Services。他们遵守 CDPA 中规定的所有适用的标准分包商安全和合规义务。

能否提供与数据安全和保护相关的信息?
AI Platform Data Labeling Service 中使用的以及 Google Cloud 中存储的所有数据均默认处于加密状态。人工标签添加者只有在添加标签的过程中才能查看您的数据。在未经您许可的情况下,我们不会泄露您的数据或将其用于除您请求的数据标签服务以外的其他任何用途。如果您删除 Data Labeling Service 标记的数据集,系统会在 24 小时内开始删除您数据的所有副本。我们实施了专门防止数据丢失、未经授权的访问或数据中出现垃圾内容的安全措施。

我可以为医疗保健数据添加标签吗?
可以,AI Platform Data Labeling Service 符合《健康保险流通与责任法案》(HIPAA) 的规定,可用于为医疗保健数据添加标签。

我可以使用哪些质量控制方法来确保标签质量?

您可以请求多个人工标签添加者来为各个数据添加注释。如果出现标签不一致,我们将征求其他标签添加者的各种意见,直到达成共识或达到您设置的标签添加者数量上限为止。

例如,如果您请求 3 个标签添加者:

  1. 对于图片分类任务,我们会让这 3 个标签添加者都对每个图片进行分类,并使用多数人的投票来确定最终答案。
  2. 对于图片边界框任务,我们将让第一个标签添加者绘制边框,然后让第二个标签添加者进行验证。如果第二个标签添加者意见不一致,并做出任何修改,我们会继续让第三个标签添加者验证,以征求多数人的意见。
相关说明对标签结果非常重要,因为它可以指导标签添加者如何为数据集添加标签。因此,我们建议您查看相关tips,了解如何创建清楚的说明。如果说明不够清楚,我们会通知您。
此外,我们建议您采用循序渐进的方式来增加数据标签作业。使用少量数据开始第一个标签作业,然后查看结果是否符合预期。根据您收到的反馈和结果修改说明,然后创建后续作业进行反复试验,直到您觉得满意后,再发送大量数据。这样可帮助您获得优质结果,同时充分利用预算。

“任务”和“操作”之间有什么区别?
任务是您使用 Data Labeling Service 执行的动作 (Action),例如导入数据、导出数据或请求加标签。操作 (Operation) 是 Google 长时间运行的作业,它使用 API 调用来完成您所请求的任务。

我如何知道(导入、导出或加标签)操作何时完成?
当您使用 Data Labeling Service API 请求导入、导出或加标签时,响应会包含将完成所请求任务的操作的名称。您可以使用操作名称来检查请求的状态
当操作正在运行时,您会看到指示进度的 progressPercent 字段(如果未显示,则进度为 0%)。操作完成后,响应将包含值 "done": true
而且,您还会收到一封相关电子邮件。

请求加标签后如何获取带注释数据集的 ID?
ListAnnotatedDatasets 会返回带注解数据集的名称。名称的格式为 projects/sample_project_id/datasets/test_dataset_id/annotatedDatasets/sample_id;ID 是 annotatedDataSets/ 后面显示的值。

如果遇到 HTTP 404 错误,并显示消息“请求的资源访问权限不可用。由于资源冲突,此请求被拒绝。”,这意味着什么呢?
它意味着当前运行的另一个操作正在使用该资源。例如,如果您在导入数据操作完成之前请求加标签,则可能会遇到此错误。

为什么我无法删除自己的数据集/说明/标签任务?
可能存在资源冲突,因为正在运行的操作正在使用该资源。

我是否必须逐个手动输入所有标签才能创建标签集?
是,如果您使用的是 AI Platform Data Labeling Service 界面,如果您使用的是 API,则可以通过编程方式传递任意数量的参数。

为什么我的图片边界框数据标签请求会在几分钟内返回并且没有任何注释?
很可能您的图片格式不受支持。

我提交标签任务已经有一段时间了,为什么进度百分比仍然显示为零?
两种可能的原因(如需了解详情,请发送电子邮件至 cloudml-data-customer@google.com):
  • 由于请求数量较多,您的任务尚未执行。 该任务已排队并将尽快启动。
  • 您为每一个数据项请求了多个标签添加者,但并非所有标签添加者对任何数据项都加了标签。例如,如果您请求了三个标签添加者,则只有在这三个标签添加者都完成了加标签操作后,系统才会将数据项标记为“已完成”。即使所有数据项都已由一个或两个标签添加者加了标签,进度百分比也将保持为零。