快速入门:完成审核任务
每个处理器都会创建一个“HITL 任务”,并将其分配给一组人工标签添加者(称为“标签添加者池”),由他们审核处理器处理的文档。处理完毕后,这些文档会加入任务队列,由指定的标注者池进行 HITL 审核。
准备工作
请先完成上文中的快速入门:配置人工审核,然后再继续操作。添加标签添加者
- 配置人工审核后,您应该会收到类似于以下内容的电子邮件:
From: AI Platform <noreply-aiplatform@google.com>\
Subject: Added to AI Platform SpecialistPool Test Labeler Group
Hello AI Platform Customer,
You are added as a manager to specialist pool
cloudml_data_specialists_us_central1_785484070008756xxxx.
To view details, visit Manager console
https://datacompute.google.com/cm/
Sincerely,
The Google Cloud AI Team
点击电子邮件中的链接(或将其剪切并粘贴到浏览器中),前往经理页面:
新创建的处理器创建的任务与该处理器同名(例如“部门 A 账单”),并会列在“任务”标签页中。
点击“标注者”标签页
点击“添加标注者”,然后添加至少一位标注者(电子邮件地址)。管理员可以是标注者,因此您可以将自己添加为标注者。
对于新创建的标注者池,必须在“分配”标签页中明确将任务分配给各个标注者。也就是说,添加标注者池不会自动将任务分配给这些新标注者。如果标签者池已预配标签者,系统会自动将该池分配给任务。
发布初始文档以供审核
通过创建的处理器发送文档以进行提取。请根据需要参阅方法指南。目前,在线(同步)调用和批量(异步)调用都支持将请求路由到支持的处理器进行人工审核。
出于测试目的,您可以使用已知的提取结果不佳的文件,以便通过信心得分低于阈值触发人工审核,也可以将阈值设置为 100%。文档限制通常为 5 页,大小上限为 20 MB,但请查看具体的处理器限制。
有一个 API 可用于跟踪转送至人工审核的每份文档。处理方响应中包含一个
humanReviewOperation
字符串,该字符串是“人工审核”中文档的操作 ID(作业名称)。您可以查询此长时间运行的操作(也称为 LRO)的状态。您可以使用
projects.locations.operations.get
方法查询转送至人工审核的文档的状态您可以使用
reviewDocument
方法强制将文档送交人工审核(请注意,此方法因处理器而异):若要使用
reviewDocument
方法,必须选中已启用人工审核复选框。使用此 API 不会覆盖配置设置。您可以按照申请人工审核指南使用此方法。
查看文档
如果文档触发了人工审核流程,但标注者池中没有标注者,则管理员会收到一封电子邮件。
> Hello AI Platform Customer, > > There is a running task for Project with Job ID 404298342016955xxxx,\ > Labeling Task ID cloudml_data_us_central1_prod_11b273b4dabdxxxx,\ > Display name \ > datalabeling-job-8005676103232389120-for-hitl-340697311810578xxxx,\ > replication count 1\ > Please see attachment for instruction.\ > Please add labelers and have them finish the task at Labeler console \ > [https://datacompute.google.com/w/cloudml_data_specialists_us_central1_7854840700087566336](https://datacompute.google.com/w/cloudml_data_specialists_us_central1_7854840700087566336){: target="external" class="external" track-type="quickstart" track-name="externalLink" track-metadata-position="body" }.\ > To view details, visit Manager console \ > [https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_7854840700087566336/tasks](https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_7854840700087566336/tasks){: target="external" class="external" track-type="quickstart" track-name="externalLink" track-metadata-position="body" }. > > Sincerely,\ The Google Cloud AI Team
这些链接供标注管理员分配标注工作。
如果标注者未注册标注组,而是新添加的,则标注管理员必须向添加的标注者发送类似的电子邮件,并附上说明。
标签添加者步骤
标签添加者流程
标签添加者的电子邮件地址
如果标注者已在第 2e 步中注册到标注组,系统会自动分配,并且他们会收到如下电子邮件:
此电子邮件中的链接是所选标签添加者处理文档标签的机制。
标记操作:
标注者点击链接进行标注时,会看到下图所示的 Interactive AI Human Review 界面。突出显示(以黄色标记)的行表示未通过验证(即得分低于配置的置信度得分阈值)且需要审核的行。
查看 将光标悬停在识别出的文本字段上,系统会显示识别出的文本以及(在其下方用较小的字体显示)字段名称(架构)。左侧面板中也会突出显示该行。
用户可以使用工具栏左上角的放大镜图标放大/缩小。
更改字段
点击该字段(左)即可对其进行修改:
您可以在左侧面板中更改值或标签。然后点击应用。
或者,您也可以点击文档图片上的任一调整大小角落图标,调整文档文本周围的边界框的大小:
如图所示,如果选择其他文本,左侧面板中相应字段的“值”中的文本也会随之更改。然后,您可以根据需要进一步修改此文字。然后点击应用。
请务必使用右上角的页面控件检查所有页面。
完成所有必要的标签更改后,点击提交(位于左下角)。结果 JSON 将保存到“结果位置”文件夹。
如果无法对文档进行满意的标注,您可以点击拒绝(位于左下角),然后选择拒绝文档的原因: - 选择原因,然后点击拒绝文档。
标注者还可以点击右上角的以下图标:
- 分析 - 显示他们已审核的文档数量(回答)和总时间。
- 通知 - 用于显示用户收到的所有通知。
- 更多(三点状图标) - 用于跳过文档、查找答案或提供反馈(如果已启用)。
- 切换标题栏(对角线箭头) - 此操作会隐藏(或显示)DataCompute 标题栏,以留出更多空间。
标签管理器
查看 Cloud Storage 中的文档
如果您想查看该文件,可以通过以下两种方式:
选项 1:
- 找到之前配置的位置中的 Cloud Storage
- 检索和下载文档
选项 2:
- 记住 URI,以便从预测响应中检索文档
- 调用 URI 以检索已审核的文档