生成 AI を活用してドキュメント データをより迅速に構造化するようになった Document AI Workbench
Google Cloud Japan Team
※この投稿は米国時間 2023 年 9 月 14 日に、Google Cloud blog に投稿されたものの抄訳です。
Document AI を使用すると、企業は、文書データを構造化して、プロセスの自動化、SLA の改善、費用削減を実現できます。また、複数の文書にわたる分析を可能にすることで、分析情報を得ることもできます。ドキュメント処理で重要なのは、企業固有のドキュメントの結果をカスタマイズできることです。
そこで Document AI Workbench をリリースしました。Document AI Workbench を使用すると、ドキュメント処理タスクのモデルをカスタマイズできます。2023 年 2 月、Google はカスタム エクストラクタの一般提供(GA)を開始し、ユーザーはドキュメントから構造化データを抽出できるようになりました。2023 年 3 月には、カスタム分類の一般提供を開始し、ドキュメント タイプを自動的に分類できるようになりました。7 月には、カスタム スプリッターの一般提供を開始し、1 つのファイル内にある複数のドキュメントを自動的に分割、分類できるようになりました。
そしてこのたび、これらのカスタム ドキュメント処理ワークフローの生産性をさらに高めるために、パワフルで新しい生成 AI テクノロジーを導入しました。Google Next ’23 では、生成 AI を使用してドキュメントの分析情報を活用することについて説明し、Document AI Workbench の生成 AI を活用した 2 つの機能(生成 AI を利用したカスタム エクストラクタと Summarizer)の公開プレビュー版のリリースを発表しました。
生成 AI を利用したカスタム エクストラクタ
生成 AI を利用した抽出の公開プレビュー版がカスタム エクストラクタ内で利用できるようになりました。生成 AI は、自由形式のテキストを多く含むドキュメント(契約書など)、複雑なレイアウトを含むドキュメント(請求書、源泉徴収票、船荷証券など)、またはトレーニング データがほとんどまたはまったくないドキュメントからデータを抽出するのに役立ちます。
生成 AI を利用したカスタム エクストラクタには、次のような独自の付加価値があります。
- 製品化までの時間の短縮: 抽出するドキュメントとフィールドを API エンドポイントに送信すると、構造化データを得られます。開始するためにモデルのトレーニングは必要ありません。いち早く利用したお客様は、カスタムモデルのトレーニングに数日を要していた作業を、1 時間以内に完了することができました。そのうえ、ドキュメントのテキストへの変換、ドキュメントの基盤モデルの選択やチューニング、複数の生成 AI ツールの統合について気にする必要はありません。
- 生成 AI の結果を簡単にカスタマイズ可能: 生成 AI の専門知識がなくても、ドキュメントのコンテンツを確認するだけで ドキュメントの生成 AI の結果をカスタマイズできます。確認後のコンテンツを Workbench が自動的に使用し、少数ショット予測で精度を向上させます。
- 最大 200 ページのドキュメントからすぐに使えるデータを抽出可能: 基盤となるモデルのコンテキスト期間や個々のドキュメント チャンクを気にする必要はありません。
開始するには、Document AI Workbench にアクセスして、カスタム エクストラクタを作成します。カスタム エクストラクタで基盤モデルが使用できるようになったため、抽出するドキュメントとフィールドを使用してエンドポイントを呼び出すだけで、構造化データを得られます。
または、ドキュメントの結果をすばやくカスタマイズしてプレビューすることもできます。まず、抽出するフィールドを定義し、サンプル ドキュメントをアップロードして結果をプレビューします。生成モデルがトレーニングなしで複数の異なるドキュメントから抽出できる項目の例を以下に示します。
精度を向上させるには、予測を確定または修正し、ドキュメントをラベル付きとしてマークします。5 つ程度のドキュメントの予測をインポートして確定すると、Workbench はその例を自動的に利用して、モデルの精度を向上させます。これは自分専用になります。
パフォーマンスに満足したら、ビルドページに移動し、定義されたフィールドとデータセット内のラベル付けされたドキュメント サンプルを使用して基盤モデルを呼び出し、少数ショット予測を強化する新しいバージョンを作成します。これにより、自分のバージョンのエンドポイントのモデルから一貫したパフォーマンスを得られます。
自動ラベル付けに使用
品質を次のレベルに引き上げるには、より大きなデータセットを準備します。ドキュメントをインポートするときに、基盤モデルを使用して自動ラベル付けを行います。次に、データセット内の予測をレビューして確定します。テストセットを使用すると、生成機能を利用したモデルの評価を実行できます。トレーニング セットを使用すると、[カスタムモデルのトレーニング] オプション内でカスタムモデルとテンプレート ベースのモデルのトレーニングを続行できます。すぐに、トレーニング セットを使用して生成モデルのパラメータ エフィシエント ファインチューニングを実行できるようになります。
最後に、モデルを並べて評価し、最もパフォーマンスの高いバージョンを本番環境にデプロイします。ドキュメントを使用してエンドポイントを呼び出すだけで、構造化データを取得できます。詳細については、デモ動画、リリースノート、ユーザーガイド、ラベル付けのベスト プラクティス、トレーニングのユースケースをご覧ください。
Summarizer
Summarizer は公開プレビュー版で利用可能で、トレーニングせずにすぐに使用でき、最大 250 ページのドキュメントのサマリーを提供します。ドキュメントのチャンクやモデルのコンテキスト期間を気にする必要はありません。選択した長さと形式に基づいてサマリーをカスタマイズできます。
利用を開始するには、Document AI Workbench にアクセスして、Summarizer を作成します。任意のドキュメントを使用してこのエンドポイントを呼び出すと、すぐにサマリーを得られます。または、サンプル ドキュメントをアップロードし、さまざまな長さ(簡潔、中程度、包括的)と形式(段落、箇条書き)でサマリーをプレビューすることによって、カスタマイズすることもできます。
選択した設定に満足したら、その内容に基づいてサマリーを提供するバージョンを作成します。ドキュメントごとに API を呼び出すときに、長さと形式の設定を指定することもできます。
最後に、利用可能なすべてのバージョンを表示し、最適なエンドポイントを呼び出してドキュメントのサマリーを取得できます。詳細については、デモ動画、リリースノート、ユーザーガイドをご覧ください。
お客様の声
前述したように、カスタム エクストラクタと Summarizer はどちらも公開プレビュー版として提供されており、Google Cloud コンソール内の Document AI Workbench で今すぐ試してみることができます。いち早く利用しているお客様の声をご紹介します。
「ドイツ銀行(DB)の各部門は、KYC や支払いフォームなどのシンプルでスケーラブルなユースケースのために、大量のドキュメントをデジタル化し、Document AI Workbench のカスタム エクストラクタを使用してデータを抽出しています。コンテンツ レビュー プロセスを自動化したことで、運用リスクが低減し、処理能力とカスタマー エクスペリエンスが向上しています。Workbench に生成 AI が導入されたので、より複雑なドキュメントを自動化してモデルのトレーニングにかかる時間を短縮させるだけでなく、Q&A や要約などの迅速なインテリジェンス機能のための新しいユースケースも探索したいと考えています。」 — ドイツ銀行、企業および投資銀行の変革担当責任者 Inwha Huh 氏
「BBVA は、お客様に可能な限り最高のエクスペリエンスを提供することに尽力しています。これには、AI を使用してビジネス プロセスを自動化することも含まれます。Document AI Workbench で利用可能になった生成 AI を使用することで、複雑で高密度の非構造化ドキュメント内のデータを抽出し、エラーや潜在的な不正行為を防止します。これにより、より速く正確で安全なサービスをお客様に提供できるようになります。」 — BBVA、インテリジェント プロセス オートメーション グローバル責任者 Antonio Valle 氏
「お客様は、エンドツーエンドの自動化とドキュメント処理機能として Automation Anywhere を利用しています。Google Cloud の Document AI Workbench とのパートナーシップを通じて、当社の共同のお客様は、生成 AI を活用して、より多くの種類のドキュメントからデータを抽出して要約できるようになりました。それだけでなく、これまでにないほど短時間でこれらのテクノロジーの使用を開始して、生成 AI とインテリジェントな自動化を利用することで、エンタープライズ プロセスを自動化し、ビジネスの成長を促進することができます。」 — Automation Anywhere、新興製品担当シニア バイス プレジデント Peter White 氏
「生成 AI は、コンテンツの要約や、インテリジェントなドキュメント処理のメリットを実現することで、当社の情報管理 / コンテンツ サービス プラットフォームの Iron Mountain InSight® の機能を向上させています。トレーニング データがまったくない、あるいは限られている非構造化ドキュメントからの抽出の品質と精度が向上することもそのメリットの一つです。そして最終的に、お客様の価値創出までの時間が短縮され、従業員のエクスペリエンスが向上します。」— Iron Mountain、アライアンス責任者兼グローバル ディレクター Helene Fox 氏
「Document AI によって、Orby の『観察、学習、自動化』を担う AI 自動化プラットフォームが強化されています。Workbench の生成 AI による抽出で、結果をカスタマイズできるようになったため、お客様は大量のドキュメントを処理しながらも高い精度を実現できます。その際、お客様はドキュメントのチャンク、コンテキスト期間、ドキュメントのテキストへの変換を気にする必要はありません。これにより、お客様の価値創出までの時間が短縮され、Document AI を活用した OrbyAI により、契約処理にかかる費用が最大 70% 削減されました。」 — Orby AI、CEO Bella Liu 氏
「当社は、各企業が自社のナレッジベースとデータソースを使用して、カスタマイズ可能で信頼性が高く、プライバシーに配慮した AI システムを構築できるように、Contextual Language Model(CLM)を提供しています。当社では Document AI とその新しい生成 AI 機能を使用して、他の抽出ソリューションではたいていキャプチャできない豊富で複雑なデータを抽出しています。生成 AI を利用するカスタム エクストラクタを使用して、少数ショット予測と微調整で精度をさらに向上させたいと思っています。Document AI で、CLM はドキュメントからさらに正確で堅牢かつスケーラブルなデータ抽出を行えています。」 — Contextual AI、製品担当バイス プレジデント Aditya Bindal 氏
改善を続ける Workbench
最後に、Google は、Document AI Workbench への投資を継続しており、最近のリリースは以下のとおりです。
- 自動での多様なサンプリング: トレーニング データセットと評価データセットの効率を向上します。
- テンプレート ベースのトレーニング: 固定レイアウト ドキュメントの高精度の抽出を実現します。
- エンドツーエンドの API を使用して、ドキュメント処理モデルの作成、トレーニング、管理、呼び出しを行えるようにするデータセット管理 API をリリースしました。
Google Cloud コンソール内の Document AI Workbench にアクセスして、これらの機能を今すぐお試しください。
ー プロダクト マネージャー Derek Egan