最佳做法和已知限制

最佳做法

  • 每個專案使用單一標籤人員集區 - 在 BYOL 情境中,雖然 HITL 設定 UI 支援為每個處理器建立新的標籤人員集區,但建議在專案的所有處理器中使用單一標籤人員集區,以簡化作業。這是因為系統仍可將多個標籤人員群組的使用者指派給同一項工作,且將標籤人員群組指派給工作後,標籤管理員仍可將其他標籤人員指派給該工作。
  • 多項工作/文件類型 - 處理單一文件類型可能需要多項工作。在下列情況下,就必須使用備用解鎖方法:
    • 審查/驗證同一份文件的不同欄位時,需要具備不同技能或憑證的標籤人員。
    • 如果文件含有不同欄位 (例如不同供應商的應付憑據),可能需要不同的驗證結構定義,因此必須轉送至不同的工作。
    • 不同客戶的文件會由不同的標註人員處理 (例如不同客戶、語言或國家/地區的發票)。
    在這種情況下,建議您建立多個處理器 (和工作),並將文件發布至適當的工作。[可能需要分類器來分類這些文件,並發布至正確的處理器]。
  • 將審查範圍限制在必要欄位 (而非頁面上所有擷取的欄位),以節省審查時間和成本 - 每個頁面的回答時間會與待審查的欄位數量呈正比。Google 標註人員的費用取決於審查的欄位數量。因此,建議您只審查下游業務程序中使用的欄位。
    • 舉例來說,發票可能包含 30 個以上的欄位,但您可能只想審查其中 4 到 5 個與結算發票相關的重要欄位。
  • 命名啟用 HITL 的處理器 - HITL 工作名稱與處理器名稱相同。建議使用標籤管理員和標籤人員都能理解的名稱,並與他們處理的其他工作輕鬆區別。
  • 工作優先順序:如果標籤人員負責多項工作,系統會依序處理這些工作。如果標註人員需要切換工作 (例如回應客戶升級或符合服務等級目標),標註管理員應使用標註管理工具控制台的「指派」分頁,取消指派目前的工作,並將高優先順序工作指派給標註人員。
    • 在主控台的「標註者 X 工作」格線 (如下所示) 中,標註管理員可以查看所有標註者指派給各項工作的作業,並微調哪些標註者負責哪些工作,以支援工作優先順序。
  • 設定驗證篩選器 驗證篩選器
  • 遭拒文件 - 文件的遭拒狀態和原因代碼 (例如文件類型不同、偽造、眩光、模糊、邊緣遭截斷等) 會擷取至文件 JSON 檔案 (所有變更的 TextChange 建構,以及遭拒原因的 HumanReview),並輸出至設定的 Cloud Storage 值區。建議使用這項中繼資料來區分遭拒的文件。
  • 處理大量文件擷取作業 - 目前的配額限制為每分鐘 600 個線上文件要求,以及最多 5 個並行的離線 (批次) 要求,每個要求最多可處理 50 份文件。預計每小時可處理 36,000 個線上要求,以及最多 15,000 個離線 (批次) 文件要求 [因為每個批次最多可處理 50 份文件]。如需較高的音量,請與支援團隊聯絡。
  • 管理人工驗證作業的費用和時間 - 無論您使用的是自有或 Google 的標籤人員,人工驗證作業的費用都有可能相當高昂。每個頁面耗用的時間會與審查的欄位數量呈正比。Google Workforce (不公開預先發布版) 審查的每個標籤都會產生費用。您可以僅將 HITL 套用至需要驗證及修正的重要欄位,藉此控管審查作業耗用的人力和費用。如要這麼做,請在「人工審查」設定畫面中使用標籤層級的驗證篩選器。
  • 使用企業憑證單一登入 - Labeler Workbench 和 Labeling Manager Console 支援 Google Workforce 或 Gmail 憑證。如果需要使用企業憑證進行單一登入,請為標註人員建立 Basic Google Workforce 帳戶。Google Workforce 支援 SAML,您可以設定單一登入 (SSO) 供應商,透過企業憑證登入 Labeler Workbench 或 Labeling Manager Console。

已知限制和解決方法

以下列出一些已知限制和可能的解決方法。我們目前正在解決這些限制。

  • 定界框必須擷取部分文字 - 如果使用人機迴圈為文件加上註解以進行訓練,繪製的任何定界框都必須偵測到部分 OCR。值不得為空白。手動輸入值無法修正這個問題。
  • 新增標籤人員集區
  • VPC-SC - 如果客戶在 HITL 專案中啟用 VPC-SC,可能無法使用 Google 標註員進行 HITL 審查。
  • 審查後延遲時間 - 文件審查完畢後,最多可能需要 30 分鐘,才會存入預先設定的 Cloud Storage 資料夾。
  • 10 頁上限 - 月結單的 HITL 審查上限為 10 頁。如果發票超過 10 頁,就不會送交 HITL 審查。
  • 單一標籤者工作流程:目前工作流程的工作僅限單一標籤者審查。如果文件需要由多位審查者審查 (例如為了進行品質保證或防範詐欺),請以「略過處理器,將所有文件送交 HITL 審查」模式,將審查過的文件上傳至第二個處理器,以便審查。
  • 編輯標註集區的標註管理員 - 在 BYOL 工作中,標註集區建立後,就無法新增或移除標註管理員。解決方法:建立新的標註集區時,
    • 請指派 1 位以上的標籤管理員,這樣一來,如果其中一位在工作完成前離職,其他管理員就能接手管理集區和指派工作。
    • 如要在標籤管理員使用者介面中查看標籤員或工作分析資訊主頁,請在建立集區時新增集區管理員。
  • 取消工作 - 工作開始後就無法取消。解決方法是標籤管理員在標籤管理工具主控台中暫停工作,或從工作中取消指派標籤人員。
  • 按一下滑鼠,即可將工作指派給整個標註者集區 - 目前不支援這項功能,但很快就會開放使用。如要解決這個問題,請選取所有標註者,然後將工作指派給他們。
  • 新增標籤人員集區
  • 使用 Google Workspace 帳戶的自備標籤員 - 如果自備標籤管理員和標籤員有 Google Workspace 帳戶,Google Workspace 管理員可能需要在 Google 服務頁面底部啟用「其他服務」(如下方螢幕截圖所示),才能啟用標籤管理員控制台和標籤員工作台的存取權。 Google Workspace