ジャンプ先

Document AI ウェアハウス

ドキュメントと AI で抽出したデータとメタデータの検索、保存、統制、管理を 1 つのプラットフォームで行います。

  • ドキュメント向けの Google のセマンティック検索テクノロジーのメリット

  • Document AI との統合により正確な分類と抽出を実現する

  • クラウド生まれの Elastic マネージド サービス: コンピューティング、ストレージ、データベースの管理とスケーリングを行います

利点

ドキュメントをすばやく見つけて整理する

構造化データと非構造化データの両方と Google のセマンティック検索テクノロジーに対応する統合ストレージをぜひご利用ください。

ドキュメント処理とワークフローを簡略化する

ドキュメントの処理、管理、ワークフローを自動化して、費用と時間を節約します。

強力なガバナンスと管理によりリスクを軽減する

充実したガバナンスとコンプライアンス ポリシーを適用し、リスクを軽減します。

主な機能

主な機能

ドキュメント、プロパティ、ワークフローを管理するための単一の API

ドキュメントには、構造化(フォームや請求書など)と非構造化(契約や研究論文など)があります。そのプロパティ(メタデータ)にはドキュメントおよび手動または AI によって割り当てられたタグ(アカウント番号、ローン ID、ドキュメント タイプなど)から AI が抽出したデータが含まれており、これらはトリガー通知を使用してワークフローやアプリケーションに統合されます。Document Explorer のインターフェースを使用すると、ワークフロー パイプラインからドキュメントの進行状況を追跡できます。これにより、ワークフロー パイプラインでエラーや処理が停止しているドキュメントを人間が検査して管理できます。また、条件付き通知も提供されます。

さまざまなドキュメントのコンテンツをすばやく見つけて整理する

ユーザーは、Document AI ウェアハウスのシンプルかつ直感的でウェブアクセス可能なユーザー インターフェースを使って、ドキュメントを検索、表示、一括更新し、フォルダに整理することができます。全文検索、セマンティック検索、ファセット検索により、ドキュメントをすばやく見つけることができます。また、カスタムの類義語(業界固有の用語や会社固有の用語)を使用し、なじみのある言葉を使用してコンテンツを検索することもできます。ドキュメントはアプリケーションに基づいて 1 つまたは複数の階層フォルダにカタログ化できます(たとえば、ID カードは KYC フォルダ、ローンフォルダ、銀行口座フォルダに配置されます)。ドキュメントを複製する必要はありません。これらのフォルダには、アプリケーション セマンティクスをサポートする独自の独立したプロパティとアクセス制御があります。 フォルダ階層内でドキュメントをドリルダウンして検索することもできます。

ドキュメントへのアクセスを管理するための強力なガバナンスとコントロール

ドキュメント レベルとフォルダレベルでのきめ細かいアクセス制御(権限)をユーザーとグループに割り当てると、ドキュメントの表示、編集、管理(共有、削除)が可能になります。Document AI ウェアハウスは、Cloud Identity(IAM)や企業ディレクトリと統合して、ユーザーとグループを Cloud Identity にプロビジョニングできるようにします。ユーザーやグループは、Azure AD、Active Directory、Keycloak などのエンタープライズ LDAP / ID プロバイダや、Google Workspace アカウントから Cloud Identity に連携または同期することもできます。

他のクラウド、オンプレミス ストレージで Document AI を使用する

Document AI ウェアハウスは、高スループットのパイプライン(近日提供予定)を提供し、Storage Transfer Service を経由して Google Cloud Storage およびオンプレミス ファイル システムからのデータの転送、取り込み(DocAI を使用)、インデックス登録を行います。Google には、Microsoft SharePoint、Amazon S3、IBM FileNet といった他のリポジトリからこのパイプラインへのドキュメントの移行、同期、連携を支援するパートナーが揃っています。このプロダクトは、ドキュメントを Document AI ウェアハウスに移行したり、コンテンツの移行に制約がある場合にリポジトリに残したりすることができる柔軟なアーキテクチャをサポートしています(コンテンツや抽出またはタグ付きされたメタデータをインデックス登録します)。

柔軟なクラウド規模のドキュメント プラットフォーム

Document AI ウェアハウスは、インフラストラクチャのスケーリングを気にすることなく、現在のドキュメントとアーカイブのドキュメントの大きなリポジトリを管理し、ビジネスに合わせて柔軟にスケーリングします。最大数億件のドキュメントの検索、保存、更新と、毎秒最大数百のトランザクションの高スループット(Google Cloud の割り当て上限内)をサポートしています。

ドキュメント

ドキュメント

クイックスタート
クイックスタート: Document AI Warehouse API を設定する

このガイドでは、Google Cloud コンソールを使用して Document AI ウェアハウスの使用を開始するために必要なすべての設定手順について説明します。 

チュートリアル
Document AI ウェアハウスを使用して取り込み、処理、検索を行う

この Codelab では、サンプルの PDF ドキュメントと Document AI ウェアハウスのユーザー インターフェースを使用して、ドキュメントの取り込み、処理、検索を行う方法を学びます。

チュートリアル
ドキュメントをフォルダで整理する

フォルダは、ドキュメントをグループ化してラベルを付けるためのコンテナとして機能します。このガイドで、フォルダの概要とフォルダを使用したドキュメントの管理方法について説明します。  

Google Cloud の基礎
Document AI ウェアハウスの監査ロギング情報

このドキュメントでは、Cloud Audit Logs の一部として Document Warehouse によって作成される監査ログについて説明します。

ユースケース

ユースケース

ユースケース
Document AI の処理

Document AI ウェアハウスにより、ユーザーはスキャンされた PDF や TIFF または特殊なドキュメント タイプのいずれかをアップロードできます。どちらも、ドキュメントが Document AI ウェアハウスにインデックス登録される前に、それぞれ Document AI OCR または専用プロセッサによって自動的に抽出されます。注: OCR とその他のドキュメント抽出器は Document AI プロダクトで使用できますが、Document AI ウェアハウスには含まれていません。

ユースケース
バッチ Document AI パイプラインを管理する

Document AI ウェアハウスは Workflows と統合され、Document AI の抽出と分類によって、ドキュメントのバッチ パイプラインを処理するテンプレートを提供します。注: これらの機能は、デプロイまたはカスタマイズできる外部のオープンソース コンポーネントとスクリプトで可能であり、Document AI ウェアハウス内には実装されていません。

ユースケース
ワークフローを定義して運用効率を改善する

Document AI ウェアハウスは、ワークフロー内のドキュメントの状態を表すプロパティと、ワークフローがドキュメントの状態を更新するために使用できる API をサポートして、ドキュメント処理のワークフローと統合されています。ドキュメント エクスプローラのインターフェースを使用すると、ワークフロー パイプラインでドキュメントの進行状況を追跡できます。Pub/Sub トピックまたは Web API 呼び出しを介して、条件付き通知をトリガーすることもできます。

ユースケース
ドキュメントの検索と探索を行う

Document AI ウェアハウスにドキュメントをアップロードすると、ドキュメントの全文検索を行うことができます。検索結果には、その検索キーワードを含むすべてのドキュメントと、その検索キーワードのハイライト表示されたドキュメント テキストの概要が表示されます。検索結果をプロパティ(日付、数値、列挙型、テキスト)でフィルタしたり、ルートフォルダ階層内で検索したりできるほか、ビジネス分野や業界に固有のカスタムの類義語を使用することもできます。

料金

従量制の料金

Document AI ウェアハウスの料金は、一定期間にわたってインデックスに登録されたドキュメント数と API 呼び出しを行った回数の 2 つの消費指標に基づいています。料金は使用した分だけ請求されます。