概念

以下是這項產品中使用的部分概念和功能:

概念 定義
查看 將擷取的欄位值與文件中的實際值進行視覺比較,並修正任何不正確的擷取結果,或新增 DocAI 處理器遺漏的擷取欄位。
標籤人員 審查擷取文件的人員。客戶可以使用自有員工 (自備標籤人員或 BYOL) 或 Google 標籤人員進行人機迴圈審查。
工作 等待標籤人員審查的擷取文件佇列。在為 HITL 審查設定後,處理器會產生單一工作。
標籤人員平台 標籤人員用來審查文件的使用者介面。使用者介面會顯示佇列中的文件,標註人員可以查看、更正,並提交或拒絕。
  • 自行標註的標註者必須擁有 Google Workforce 或 Gmail 帳戶,才能存取標註 UI。
  • 標註人員可在工作指派時,透過標註管理員傳送的電子郵件連結存取 Workbench。
回答時間 這是標註者處理文件所需的時間。標籤人員工作室會追蹤文件提交時間,並提供效率分析 (例如每位標籤人員的文件審查時間)。
標籤管理工具 系統會將一或多位標註管理員指派給標註人員群組,讓他們執行下列操作:
  • 新增或移除標註員到標註員集區。
  • 指派或取消指派工作給標註人員。標註者管理員可存取專案中的所有工作。他們可能會根據工作優先順序變更指派給標註員的工作。
  • 暫停工作,讓標註人員處理下一個指派給他們的工作。
在 BYOL 情境中,標示管理員由客戶提供。 使用 Google 標註人員時,Google 會提供標註管理工具。
標籤管理工具主控台 標籤管理工具使用的 UI,用於管理標籤人員資源池和工作分配。開啟控制台
工作中的文件狀態為排入佇列、已回答、已完成、已拒絕 工作是持續的工作流程。文件會經歷下列狀態:
  • 已排入佇列:處理器處理文件後,會將文件排入佇列 (新增) 至 HITL 工作。
  • 已回答 - 當標註人員完成文件審查、修正及提交作業後,系統會將文件完成,並儲存在客戶設定的 Cloud Storage 值區中。
  • 已完成 - 如果任務啟用複製功能,且所有標籤人員都已回答文件問題 (多位標籤人員處理任務中的每份文件)。如果工作沒有複製 ( 由單一標註者審查),則「已回答」與「已完成」相同。
  • 已拒絕:如果文件無效 (不同類型的文件、偽造文件等) 或品質不佳 (有炫光、邊緣裁切等),系統可能會拒絕
每個處理器一個工作 我們不支援每個處理器執行多項工作。如果客戶需要在不同工作中處理單一文件類型 (例如月結單),可以使用 HITL Review 設定多個處理器。
工作指派與標籤人員集區 標註管理工具會將標註人員加入集區。加入後,您可以將池中的任何標註者指派給工作。 請注意,「標註者資源池」與指派給工作任務的標註者「群組」不同。集區是在專案層級管理,用於決定標註人員對數據分析和工作內容的存取權。池中的任何標註者都可以指派至專案中的多個任務。
標籤人員集區 標註者集區是在專案層級建立,請勿與工作分配混淆。標註管理員可以指派任何標籤人員來執行工作,讓多位標籤人員可以同時審查文件,加快工作進度。客戶可以將標註者資源池指派給專案中的任何工作。
驗證篩選器和門檻 擷取的欄位會有可信度分數 (0-100),代表 DocAI 擷取結果的準確度。客戶可以為每個欄位設定驗證門檻,這樣系統就只會將欄位數量低於此驗證門檻的網頁排入待審查佇列,超過門檻的欄位則不會排入佇列。 客戶可以設定 3 種驗證篩選器:
  • 欄位層級篩選器:選取需要審查的重要欄位,並為每個欄位指定信心門檻。如果任何欄位的門檻設為 100%,系統就會將所有包含該欄位的網頁送交審查。
  • 文件層級篩選器:選取整體文件層級的可信度門檻。如果任何欄位低於門檻,整個網頁都會送審。如果這個門檻設為 100%,系統就會將所有預測的文件送交審查。
  • 無篩選條件:所有發布至 HITL 端點的文件都會送交審查。
標籤管理工具數據分析 標註管理工具會取得每項工作和每位標註者的分析資料,包括已排入佇列、已回答、已略過、已完成、平均處理時間/文件和總答覆時間。 您可以在 Labeling Manager 主控台的「Analytics」分頁中存取數據分析資料。