2022 年 12 月のリリース
HITL 構成ステッパー
[Human-In-The-Loop] の [構成] タブが、手順の順序付きペアとしてフォーマットされ、より簡単で構造化された設定エクスペリエンスを実現できるようになりました。
ユーザーは、スペシャリスト プールと HITL をトリガーするフィルタに関連する設定を構成する個別の手順を表示し、スペシャリストの手順と結果の場所を選択できるようになりました。
2022 年 10 月のリリース
HITL リクエスト担当者向け分析ダッシュボード
人間参加型(HITL)に専用の [分析] タブが追加されました。このタブでは、プロセッサごとの HITL タスクのステータスを分析し、必要に応じて変更するための指標とグラフが提供されます。
現在、ユーザーが確認できる指標は 3 つあります。データは、ユーザーに次のオプションを提供する期間選択ツールで集計できます。
選択した期間ごとに、次の情報を確認できます。
- 集計統計: 選択した期間について、キューに正常にアップロードされたドキュメントの合計数、スペシャリストによって完了(送信と不承認)されたドキュメントの合計数、キューに最も古いドキュメントが追加されてからの時間のスナップショット ビュー。
- 人間参加型アクティビティ グラフ: ドキュメントがキューに追加されたとき(
enqueuedDocumentCount
)と、スペシャリストによってドキュメントが完了したとき(completedDocumentCount
)の時系列データを示すグラフ。 - 人間参加型のトリガー率: 選択した期間内に人間参加型のレビューをトリガーしたアップロード済みドキュメントの割合の時系列データを示すグラフ。
- 集計統計: 選択した期間について、キューに正常にアップロードされたドキュメントの合計数、スペシャリストによって完了(送信と不承認)されたドキュメントの合計数、キューに最も古いドキュメントが追加されてからの時間のスナップショット ビュー。
2022 年 9 月のリリース
注: Document AI Workbench、Purchase Order(PO)、Invoice、Expense の各プロセッサを使用しているお客様は、チェックボックスにラベルを付け(スキーマで定義されている場合)、HITL アノテーションとレビューの UI でネストされたエンティティ(親子関係など)を正確に表現できる新しいスキーマにアクセスできます。新しいスキーマに対応するプロセッサが増えるにつれて、このリリースノートも更新されます。
ネストされたエンティティ
- アノテーション UI で、ネストされたエンティティのラベル付けがサポートされるようになりました。左側のパネルが更新され、ネストされたエンティティを表すネストされた行の新しい外観が表示されます。「parent」の値は、すべての子の連結です。
- 左側のパネルでエンティティを選択すると、親ラベルと子ラベルが表示されます。
- ドキュメント内のエンティティ ラベル メニューも更新され、ネストされたエンティティ ラベリングがサポートされます。
- ネストされたラベルをクリックすると、ネストされた子エンティティの正しい親エンティティを割り当てるためのダイアログ ボックスが表示されます。
チェックボックス
- アノテーション UI はチェックボックスのラベル付けをサポートしています。左側のパネルでは、行内でチェックボックスを編集できます。
- エンティティの編集ダイアログ ボックスでチェックボックスを編集することもできます。
2022 年 8 月のリリース
エンティティ ラベルの選択
- エンティティ ラベルの入力がプルダウン リストに置き換えられました。このプルダウン リストには、新しいエンティティを追加する際に使用可能なラベル オプションが表示されます。この変更により、ラベル作成者がタイプミスをしたり、不要なエンティティ ラベルを作成したりするのを防ぐことができます。
ISO 日付形式
- 正規化された日付は ISO 8601 の日付形式(yyyy-mm-dd)で表示されます。
2022 年 7 月のリリース
クイック確認ボタン
- エンティティ ツールチップに [確認] ボタンが表示され、エンティティ/ラベルの値をすばやく確認できます。編集ボタンが削除されました。ユーザーはエンティティのツールチップを直接クリックして編集できます。
2022 年 1 月のリリース
エンティティ ラベル オプション
- エンティティ ラベルの選択オプションが、フィルタされたフィールドのリスト(HITL フィルタ構成で設定)に制限されるようになりました。
Missing Fields(欠落しているフィールド)
- 欠落しているフィールド(HITL フィルタ構成で「必須」とマークされているが、プロセッサがフィールドの値を予測していないフィールド)が赤色で表示されるようになり、審査担当者がフィールドの値を簡単に更新できるようになりました。
ランダムな完了サンプル
- ランダム サンプル(1 日の量の 2% など)のドキュメントの完全なレビュー(フィルタされたフィールドだけでなく、ドキュメント内のすべてのエンティティ)がサポートされるようになりました。これは、各フィールドのモデルのドリフトとプロセッサの精度に関する分析情報をモニタリングするのに役立ちます。これらの分析情報は、アップトレーニングが必要なタイミングを把握するために使用されます。これは、モデルのアップトレーニング用のラベル付きグラウンド トゥルースを含むデータセットとしても機能します。
- お客様は、ボリュームに基づいてランダム サンプル [1 ~ 10%] をオプトインして設定できます。1 週間あたり 100 ~ 500 件のサンプルをターゲットにすると効果的です。たとえば、お客様が 1 週間あたり 10,000 件のドキュメントを処理する場合、これは 500 / 10,000 = 5% に設定されることがあります。
初回ユーザー向けの簡素化された HITL 構成
- 初めて HITL を利用するお客様向けに、BYOL HITL の構成を簡素化しました。これにより、タスクの構成、スペシャリストの割り当て、単一の画面からの起動を迅速に行うことができます。そのため、本番環境のボリュームを拡大したり、オペレーションをアウトソーシングしたりする前に、迅速に試すことができます。
- 下のスクリーンショットに示すように、ユーザーはプールのデフォルトのマネージャーになり、追加のスペシャリストを追加できます。追加したスペシャリストはすべて、同じ画面でタスクに自動的に割り当てられます。
- 以前は、割り当てられたマネージャーにマネージャー コンソールへのリンクがメールで送信され、マネージャーがスペシャリストを追加して、これらのスペシャリストにタスクを割り当てていました。
- タスクを送信すると、スペシャリスト(および割り当てられた他のスペシャリスト)は HITL アプリに移動してドキュメントを確認できます。
- ユーザーは、テスト ドキュメントをタスクキューに(一度に 1 つずつ)アップロードすることもできます。
末尾の改行を削除
- エンティティの mentionText から末尾の改行(\n)が削除されます。
2021 年 12 月のリリース
信頼度の低いスコア エンティティを上位に並べ替える
- 信頼スコアの低いエンティティ(信頼しきい値を下回るエンティティ)がページの上部に並べ替えられるようになり、スペシャリストはこれらのエンティティに集中できるようになりました。これにより、ラベル付けの効率がさらに向上します。
BYOL タスクの説明は省略可能
- HITL タスクを構成するためにアップロードする PDF 手順が省略可能になりました。これにより、スペシャリストが手順ガイドを必要としないテストや迅速な社内リリースが簡素化されます。
幅に合わせる、高さに合わせるオプション
- ページを幅または高さに合わせるボタン。これは、スペシャリストがタスクでさまざまなサイズのドキュメント(領収書など)を扱う場合に便利です。
スペシャリスト UI に表示されるタスク名
- タスク名がスペシャリスト UI に表示されるようになり、タスクとドキュメントのタイプに関する追加のコンテキストが提供されるようになりました。これは、スペシャリストが複数のタスクに割り当てられている場合に非常に便利です。
- これは、このリリースの後にスピンアップされた新しいプロセッサに表示されます。
スペシャリストの検索ボックス
- スペシャリストは、ドキュメント内のエンティティやテキストを検索できます。これは、特に複数ページにわたる大規模なドキュメントで役立ち、スペシャリストの生産性を高めます。
2021 年 9 月のリリース
切り替えてすべてのフィールドを表示する
- ラベル付け担当者は、キュー内の特定のドキュメントのフィルタリングされたエンティティ セットに含まれていないフィールドを確認して更新する必要がある場合があります。[すべての予測を表示] オプションを切り替えると、ラベル付け担当者はフィルタされていないフィールドを確認できます。
Form パーサーの HITL
- HITL が Form パーサーをサポートするようになりました。ユーザーは、Form パーサーで抽出された Key-Value ペアを確認して修正できます。お客様は、DocAI プラットフォームのフォーム パーサー プロセッサで HITL を有効にし、HITL レビューでフィルタリングするキー名(下のスクリーンショットを参照)を構成できます。HITL 出力は、HITL レビューの完了後に、お客様が指定した Google Cloud Storage バケットに JSON ファイルとしてドロップされます。
- たとえば、「customer, customer name, client, account #, account number」のように、カンマ区切りの代替キー名を指定できます。これにより、HITL フィルタはすべてのキー名バリエーションを含むドキュメントをキャッチし、HITL レビューに送信します。
2021 年 8 月のリリース
監査/QA パイプライン
- HITL で第 2 段階の QA または監査段階が可能になり、レビュー タスク(およびラベラー)の精度が報告されるようになりました。QA チームまたは監査担当者をタスクの「エキスパート ラベラー」として割り当てることができます。QA チームまたは監査担当者は、レビューされたドキュメントの X%(1 ~ 100% の範囲で、お客様が構成可能)を受け取ります。監査担当者は審査担当者の出力を修正できます。システムは修正を追跡し、監査対象の各ドキュメントに精度スコア(90% など)を割り当てます。タスクまたはラベラーの総合的な精度スコアは、それぞれタスクとラベラーの分析ダッシュボードに表示されます。
- 監査パイプラインを構成する手順の詳細をご覧ください。
- 監査役の指定
- レポートの精度
AI 融資パーサー(8 月 15 日)
- HITL は、1040、1040 Schedule E、1040 Schedule C、1099 DIV、1099 G、1099 INT、1099 MISC、給与明細書、銀行明細書、W2、W9、1120、1120S、1065、SSA-1099、1099 NEC、1099-R などの一部の Lending AI パーサーでサポートされるようになりました。
2021 年 7 月のリリース
標準キューと緊急キュー(7 月 2 日)
- 各ドキュメントの緊急度に基づいて、各プロセッサで 2 つの優先度キュー(1 つのキュー)がサポートされるようになりました。
- 送信 - 予測後、抽出されたドキュメントの緊急度を評価し、ドキュメントの緊急度に基づいて 2 つのキュー(標準と緊急/ファスト トラック)に送信できます。たとえば、お支払い期限が迫っている請求書は、ファストトラック キューに送信できます。緊急度を評価するロジックは現在 HITL の外部にあり、カスタム関数にすることができます。
- タスクの割り当て - ラベリング マネージャーには、次のスクリーンショットに示すように、優先度の異なる 2 つのキューが表示されます。同じラベラー グループを両方のキューに割り当てることができます。
- タスクの優先順位付け - 両方のタスクに割り当てられたラベル付け担当者は、常に標準キューを処理する前にファストトラック キューの保留中のドキュメントを処理します(キューの優先順位付けはシステムによって自動的に処理されます)。
- API 呼び出し - ReviewDocument の priority フィールドを設定する
- UI のスクリーンショット(ラベル マネージャー UI のタスク) -
2021 年 6 月のリリース
HITL エンドポイントの検証フィルタ(6 月 24 日)
- 信頼スコアでフィールドをフィルタして、人間による審査のためにキューに登録するドキュメントを決定する検証フィルタ(プロセッサで構成)が、HITL エンドポイントに送信されたドキュメントにも適用されるようになりました。
- ReviewDocument API を呼び出すときに、enable_schema_validation フィールドを true に設定します。
- この設定が有効になっており、検証の結果、ドキュメントで人間による審査をトリガーする必要がないと判断された場合は、CANCELLED エラーが返されます。
Cancel API
お客様は、特定のオペレーション ID の Cancel API を呼び出すことで、HITL 処理のためにキューに登録されたドキュメントをキャンセルできます。HITL に送信されたドキュメントごとにオペレーション ID が返されます。
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
請求書タイプ(分類レビュー)
- Labeler Workbench は、請求書タイプの分類の確認をサポートしています。
キュー内の時間(HITL レイテンシ SLO)レポート
- レポートには、18 時間以上と 24 時間以上キューに登録されているドキュメントの数が表示されます。これは、HITL レイテンシの SLO 期待値を管理する必要があるユーザーに役立ちます。
ラベラー ワークベンチの既知の URL
- 単一のプールに割り当てられたラベラーは、既知の URL でワークベンチにアクセスできるようになりました。メール通知(システムまたはラベリング マネージャーから)で送信されたわかりにくい URL を探す必要はありません。この URL は、複数のプールに割り当てられたラベラーでは機能しません。
ズーム設定の保持
- プラグインで、キュー内の次のドキュメントのレビュー用にラベル付け担当者のズーム設定(全幅または全ページ)が記憶されるようになりました。これにより、ドキュメントごとにズームインする必要がなくなります。
Form パーサーの HITL
- HITL でフォーム パーサーがサポートされるようになりました。ユーザーは、Form パーサーで抽出された Key-Value ペアを確認して修正し、DocAI プラットフォームの Form パーサー プロセッサで HITL を有効にして、HITL レビューでフィルタするキー名(下のスクリーンショットを参照)を構成できます。HITL 出力は、HITL レビューの完了後に、お客様が指定した Google Cloud Storage バケットの JSON ファイルに保存されます。
- フォーム パーサーで HITL を構成するための UI のスクリーンショット
- キーレベルの検証を構成する UI
- ラベラー UI
監査/QA パイプライン
- HITL で第 2 段階の QA または監査段階が可能になり、レビュー タスク(およびラベラー)の精度が報告されるようになりました。QA チームまたは監査担当者をタスクの「エキスパート ラベラー」として割り当てることができます。QA チームまたは監査担当者は、レビューされたドキュメントの X%(1 ~ 100% の範囲で、お客様が構成可能)を受け取ります。監査担当者は審査担当者の出力を修正できます。システムは修正を追跡し、監査対象の各ドキュメントに精度スコア(90% など)を割り当てます。タスクまたはラベラーの総合的な精度スコアは、それぞれタスクとラベラーの分析ダッシュボードに表示されます。監査パイプラインを構成する手順は次のとおりです。
監査役の指定
レポートの精度
AI 融資パーサー(7 月 31 日)
- HITL が、1040、1040 Schedule E、1040 Schedule C、1099 DIV、1099 G、1099 INT、1099 MISC、給与明細書、銀行明細書、W2、W9、1120、1120S、1065、SSA-1099、1099 NEC、1099-R などの一部の Lending AI パーサーでサポートされるようになりました。
標準キューとファスト トラック キュー(7 月 2 日)
- 各ドキュメントの緊急度に基づいて、各プロセッサで 2 つの優先度キュー(1 つのキュー)がサポートされるようになりました。
- 送信 - 予測後、抽出されたドキュメントの緊急度を評価し、ドキュメントの緊急度に基づいて 2 つのキュー(標準と緊急/ファスト トラック)に送信できます。たとえば、お支払い期限が迫っている請求書は、ファストトラック キューに送信できます。緊急度を評価するロジックは、カスタム関数を使用して入力できます。
- タスクの割り当て - ラベリング マネージャーには、次のスクリーンショットに示すように、優先度の異なる 2 つのキューが表示されます。同じラベラー グループを両方のキューに割り当てることができます。
- タスクの優先順位付け - 両方のタスクに割り当てられたラベル付け担当者は、常に標準キューを処理する前にファストトラック キューの保留中のドキュメントを処理します(キューの優先順位付けはシステムによって自動的に処理されます)。
- API 呼び出し - ReviewDocument の priority フィールドを設定する
- UI のスクリーンショット(ラベル マネージャー UI のタスク)
HITL エンドポイントの検証フィルタ(6 月 24 日)
- 信頼スコアでフィールドをフィルタして、人間による審査のためにキューに登録するドキュメントを決定する検証フィルタ(プロセッサで構成)が、HITL エンドポイントに送信されたドキュメントにも適用されるようになりました。
ReviewDocument
API を呼び出すときに、enable_schema_validation フィールドを true に設定します。この設定が有効になっており、検証の結果、ドキュメントで人間による審査をトリガーする必要がないと判断された場合は、CANCELLED エラーが返されます。
Cancel API
特定のオペレーション ID の Cancel API を呼び出すことで、HITL 処理のためにキューに登録されたドキュメントをキャンセルできます。[HITL に送信されたドキュメントごとにオペレーション ID が返されます]
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
請求書タイプ(分類レビュー)
- Labeler Workbench は、請求書タイプの分類の確認をサポートしています。
キュー内の時間(HITL レイテンシ SLO)レポート
- レポートには、18 時間以上と 24 時間以上キューに登録されているドキュメントの数が表示されます。これは、HITL レイテンシの SLO 期待値を管理する必要があるユーザーに役立ちます。
ラベラー ワークベンチの既知の URL
- 単一のプールに割り当てられたラベル付け担当者は、既知の URL https://datacompute.corp.google.com/w/ でワークベンチにアクセスできるようになりました。これは、システムまたはラベル付けマネージャーから送信された URL が記載されたメールを紛失した場合に便利です。この URL は、複数のプールに割り当てられているラベラーでは機能しません。
ズーム設定の保持
- プラグインで、キュー内の次のドキュメント レビュー用にラベル付け担当者のズーム設定(全幅または全ページ)が保存されるようになりました。これにより、ドキュメントごとにズームインする必要がなくなります。