コンセプト

このプロダクトで使用されているコンセプトと機能は次のとおりです。

コンセプト 定義
確認 抽出されたフィールド値をドキュメント内の実際の値と視覚的に比較し、誤った抽出を修正したり、DocAI プロセッサで抽出されなかったフィールドを追加したりするプロセス。
ラベラー 抽出されたドキュメントを確認するユーザー。お客様は、独自の従業員(Bring-your-own-labeler または BYOL)を使用するか、HITL レビューに Google ラベラーを使用できます。
タスク ラベル付け担当者が確認する抽出済みドキュメントのキュー。HITL 審査用に構成されている場合、プロセッサは 1 つのタスクを生成します。
ラベラー ワークベンチ ラベル付け担当者がドキュメントの確認に使用する UI。UI にはキュー内のドキュメントが表示されます。ラベル付け担当者はドキュメントを確認して修正し、送信または却下できます。
  • BYOL ラベラーがラベリング UI にアクセスするには、Google Workforce アカウントまたは Gmail アカウントが必要です。
  • ラベル付け担当者は、タスクの割り当て時にラベル付けマネージャーからメールで送信されるリンクからワークベンチにアクセスできます。
Answer Time(回答時間) ラベル付け担当者がドキュメントの処理に要した時間。Labeler Workbench は、ドキュメントの送信時間を追跡し、効率分析(ラベル付け担当者ごとのドキュメント レビューなど)を表示します。
ラベル付けマネージャー 1 人以上のラベル付けマネージャーがラベル付け担当者のプールに割り当てられ、次の操作を行えるようになります。
  • ラベル付け担当者をラベル付け担当者プールに追加または削除します。
  • ラベル付け担当者にタスクを割り当てるか、割り当てを解除します。プロジェクト内のすべてのタスクにラベル付けマネージャーがアクセスできます。タスクの優先順位の変更に基づいて、タスクの割り当てをラベラーに変更することがあります。
  • タスクを一時停止して、ラベル付け担当者が割り当てられた次のタスクに取り組めるようにします。
BYOL シナリオでは、ラベル付けマネージャーはお客様が提供します。Google ラベラーを使用する場合、Google は Labeling Manager を提供します。
ラベル マネージャー コンソール ラベル マネージャーがラベラー プールとタスクの割り当てを管理するために使用する UI。コンソールを開きます
タスク内のドキュメントのキュー登録、回答済み、完了、却下 タスクは継続的なワークフローです。ドキュメントは次の状態になります。
  • キューに登録済み - ドキュメントがプロセッサで処理されると、HITL タスクにenqueued(追加)されます。
  • 回答済み - ドキュメントが Labeler によって確認、修正、送信されると、完了となり、お客様が構成した Cloud Storage バケットに保存されます。
  • 完了 - タスクで複製が有効になっている場合(タスク内の各ドキュメントを複数のラベラーが処理している場合)、すべてのラベラーがドキュメントに回答したとき。タスクに複製がない場合(1 人のラベラーによってレビューされた場合)、[Answered](回答済み)は [Completed](完了)と同じです。
  • 不承認 - ドキュメントが無効(ドキュメント タイプが異なる、偽造など)または品質が低い(グレア、端が切れているなど)場合、ドキュメントは不承認となることがあります。
プロセッサごとに 1 つのタスク プロセッサごとに複数のタスクはサポートされていません。お客様が異なるタスクで単一のドキュメント タイプ(請求書など)を処理する必要がある場合は、HITL レビューで複数のプロセッサを構成できます。
タスクの割り当てとラベル付け担当者プール ラベル付けマネージャーは、ラベル付け担当者をプールに追加します。追加すると、プール内の任意のラベラーをタスクに割り当てることができます。なお、「ラベル付け担当者プール」は、タスクに割り当てられたラベル付け担当者の「グループ」と混同しないでください。プールはプロジェクト レベルで管理され、アナリティクスとタスクに対するラベラーのアクセス権を決定するために使用されます。プール内の任意のラベラーをプロジェクト内の 1 つ以上のタスクに割り当てることができます。
ラベラープール ラベル付け担当者のプールはプロジェクト レベルで作成されます。タスクの割り当てと混同しないでください。ラベル付け管理者は、タスクに割り当てられた任意のラベル付け担当者を割り当てることができます。これにより、複数のラベル付け担当者がドキュメントを並行してレビューし、タスクをより迅速に完了できます。ラベル付け担当者プールは、お客様がプロジェクト内の任意のタスクに割り当てることができます。
検証フィルタとしきい値 抽出されたフィールドには、DocAI の抽出が正確であるという信頼度を表す信頼スコア(0 ~ 100)があります。お客様は各フィールドの検証しきい値を構成できます。この検証しきい値を下回るフィールドを含むページのみが審査のためにキューに登録され、しきい値を上回るフィールドはキューに登録されません。お客様が構成できる検証フィルタには、次の 3 種類があります。
  • フィールド レベルのフィルタ - 確認が必要な重要なフィールドを選択し、各フィールドの信頼度のしきい値を指定します。このしきい値がフィールドに対して 100% に設定されている場合、このフィールドを含むすべてのページが審査に送信されます。
  • ドキュメント レベルのフィルタ - ドキュメント レベルの全体的な信頼度のしきい値を選択します。いずれかのフィールドがしきい値を下回っている場合、ページ全体が審査に送られます。このしきい値を 100% に設定すると、予測されたすべてのドキュメントが審査に送信されます。
  • フィルタなし - HITL エンドポイントに送信されたすべてのドキュメントが審査に送信されます。
Labeler Manager Analytics ラベリング マネージャーは、キュー登録済み、回答済み、スキップ済み、完了済み、ドキュメントあたりの平均処理時間、回答時間の合計など、各タスクと各ラベラーの分析情報を取得します。アナリティクスには、ラベル マネージャー コンソールの [アナリティクス] タブからアクセスします。