コンテンツに移動
AI & 機械学習

Document AI: ドキュメント処理の要件に対応した統合 AI エージェント

2022年11月15日
Google Cloud Japan Team

※この投稿は米国時間 2022 年 11 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。

このブログを Google ドキュメントに書きながら、私は、コミュニケーションやコラボレーション、ビジネスを行うために、私たちがデジタル ドキュメントにどれだけ依存しているかを考えずにはいられません。それなのに、ドキュメント内にある大半のデータは相変わらず分析されないままの状態です。住宅ローンの申請や契約の処理など、顧客向けのワークフローで使われるドキュメントでも、企業はそれに含まれるデータの処理に苦慮することが少なくありません。組織全体の膨大な情報の中から適切なドキュメントを見つけるのさえ困難な場合もあります。このような問題を解決するために、ほとんどの組織は時間と人手を大量に必要とする手動プロセスに頼っています。いずれの手動プロセスも、ドキュメント ワークフローの最前線にいる従業員にとって大きなストレスになっています。

こうした問題を踏まえ、私たちは 2020 年に Document AI をリリースしました。これは AI エージェントで、組織にとって特に困難なドキュメント自動化の問題に機械学習(ML)を適用できます。以来、住宅ローンの処理調達など、業界固有のユースケース向けにデータを抽出する特殊なモデルを導入してきました。Google は、Cloud Next ‘22 で Document AI Workbench と Document AI ウェアハウスを発表し、組織によるドキュメント処理の簡素化と自動化を支援するという使命に向けて、注目すべき取り組みを続けています。それぞれの発表をダブルクリックしてみましょう。

https://storage.googleapis.com/gweb-cloudblog-publish/images/document_ai.max-1800x1800.jpg

Document AI Workbench によるカスタム ドキュメント処理

Document AI Workbench を使用すると、ビジネス ニーズごとにカスタム ML モデルを作成してドキュメントを処理し、高い精度で非構造化データを抽出できます。わかりやすいインターフェースにより、ML について専門的なスキルを持たないビジネス ユーザーでも、モデルのトレーニングやアップトレーニングを開始できます。

さらに、組織が事前トレーニング済みモデルから転移学習を行い、たとえば新しいフィールドを含めることでモデルをさらに強化しようと考えた場合、ユーザーは「アップトレーニング」という機能によってそれを実現できます。アップトレーニング機能は、時間も人手も節約でき、ゼロから始める必要がないので、一般的ではあるものの複雑なユース ケースの場合にとりわけ価値があります。請求書、注文書(PO)、契約書、W2、1099-R、給与明細、1040 といったドキュメントで事前トレーニング済みモデルをアップトレーニングすることで、精度の向上、新しい言語サポートの追加、スキーマのカスタマイズについて新たな可能性が開かれます。

Google は今後も事前トレーニング済みモデルへの投資を継続していきます。Next '22 では、請求書と経費の事前トレーニング済みモデルの更新を発表しました。この更新では、正規化と項目エンティティの検出が向上し、ID ドキュメントの偽造や改ざんを見つけるために設計された柔軟な API を使用した新しい ID 確認機能が改良されました。すでにサポートしている 12 の言語に加えて、請求書と経費のモデル全体で 5 つの新しい言語に対応しました。また、米国、EU、シンガポールのリージョンの他に、カナダとオーストラリアのリージョンでも利用できるようになりました。

Deloitte Consulting LLP のマネージング ディレクターである Daan De Groodt 氏は、次のように話します。「(Document AI Workbench は)ドキュメント処理に大きな変革をもたらす可能性を秘めています。効果的な Google 機械学習モデルを活用してさまざまなテキスト ドキュメントやテキスト フォームをアップトレーニングし、より望ましい精度を実現することで、クライアントの時間とリソースの利用効率を高められるようになったからです」。

ユーザーは、すでにさまざまなメリットを活用しています。Libeo は、Document AI を利用して、請求書パーサーを 1,600 件のドキュメントでアップトレーニングし、テストの精度を 75.6% から 83.9% に向上させました。「アップトレーニングのおかげで、現在、Document AI の成果は競合他社の成果を上回っており、長期的にモデル トレーニングの全体的な費用が約 20% 節約できることが見込まれます」と、Libeo の最高技術責任者である Pierre-Antoine Glandier 氏は話します。

Document AI ウェアハウスを使用した Google によるドキュメント検索

Document AI ウェアハウスにより、ドキュメントで Google のセマンティック検索を最大限に活用できるようになりました。Document AI ウェアハウスを使用すると、企業はドキュメントと、AI により抽出されたデータやメタデータを 1 つのプラットフォームで検索、保存、統制、管理できます。ユーザーは、Document AI ウェアハウスのシンプルかつ直感的でウェブアクセス可能なユーザー インターフェースを使って、ドキュメントを検索、表示、一括更新し、フォルダに整理することができます。エンタープライズ向けの堅牢な制御とガバナンス機能をもつ Document AI ウェアハウスは、ドキュメント レベルやフォルダレベルのアクセス権を持つユーザーを制御し、ドキュメントの表示、編集、管理(共有、削除)権限をユーザーやグループに割り当てます。Microsoft SharePoint、Amazon S3、IBM FileNet といった他のリポジトリからドキュメントの移行、同期、統合ができます。コンテンツと、抽出したメタデータやタグ付けしたメタデータを、インデックス登録のみ行うこともできます。

また、Google は今年末までに Document AI OCR と Form パーサーに多くの次世代プロダクトを追加、統合します。これには、ドキュメントの品質とセマンティクスに関する詳細な分析、ドキュメント OCR エクスペリエンスの統合、Form パーサーの対応言語の拡大、モデルのライフサイクル管理のための高度なツールの追加が含まれます。Google の DeepMind チームは、公共料金請求書や注文書用のドキュメント解析 ML モデルを、Document AI で従来必要とされていたよりも 50~70% 少ないトレーニング データで作成できる新しい方法を開発しました。今後数か月以内に、この方法を Document AI Workbench に統合する予定です1

使ってみる

ドキュメントの自動化を簡素化する企業向けプラットフォームとして、Document AI の今後がとても楽しみです。ここで取り上げたすべての魅力的な開発について詳しくは、Next ’22 の私のセッションをご覧ください。いずれかのサービスを今すぐお試しいただくこともできます。


1. DeepMind は、公共料金請求書やさまざまなベンダーからの注文書などの Google 内部の何千ものドキュメントを使用して、この方法を開発し、評価しました。パフォーマンスは評価データセットによって異なります。


- 言語および Document AI 担当プロダクト責任者 Sudheera Vanguri
投稿先