コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。
Document AI ウェアハウスについて詳しくは、Next'22 のブレイクアウト セッションをご覧ください。ぜひご覧ください。
ジャンプ先

Document AI ウェアハウス

ドキュメントと AI で抽出したデータとメタデータの検索、保存、統制、管理を 1 つのプラットフォームで行います。

  • ドキュメントのための Google のセマンティック検索テクノロジーの強み

  • Document AI との統合により正確な分類と抽出を実現する

  • クラウド生まれの Elastic のマネージド サービス: コンピューティング、ストレージ、データベースの管理とスケーリングを行う

利点

ドキュメントをすばやく見つけて整理する

構造化データと非構造化データの両方と Google のセマンティック検索テクノロジーに対応する統合ストレージをぜひご利用ください。

ドキュメント処理とワークフローを簡略化する

ドキュメントの処理、管理、ワークフローを自動化して、費用と時間を節約します。

強力なガバナンスと管理によりリスクを軽減する

充実したガバナンスとコンプライアンス ポリシーを適用し、リスクを軽減します。

主な機能

主な機能

ドキュメント、プロパティ、ワークフローを管理するための単一の API

ドキュメントには、構造化(フォームや請求書など)と非構造化(契約や研究論文など)があります。そのプロパティ(メタデータ)にはドキュメントおよび手動または AI によって割り当てられたタグ(アカウント番号、ローン ID、ドキュメント タイプなど)から AI が抽出したデータが含まれており、これらはトリガー通知を使用してワークフローやアプリケーションに統合されます。Document Explorer のインターフェースを使用すると、ワークフロー パイプラインからドキュメントの進行状況を追跡できます。これにより、ワークフロー パイプラインでエラーや処理が停止しているドキュメントを人間が検査して管理できます。また、条件付き通知も提供されます。

さまざまなドキュメントのコンテンツをすばやく見つけて整理する

ユーザーは、Document AI ウェアハウスのシンプルかつ直感的でウェブアクセス可能なユーザー インターフェースを使って、ドキュメントを検索、表示、一括更新し、フォルダに整理することができます。全文検索、セマンティック検索、ファセット検索を使えば、ドキュメントにすばやくアクセスできます。また、カスタムの類義語(業界固有の用語や会社固有の用語)を使用して、使い慣れた単語でコンテンツを探すこともできます。ドキュメントは、ドキュメントを複製することなく、アプリケーションに基づいて 1 つ以上の階層型フォルダにカタログ化できます(たとえば、ID カードは KYC フォルダ、ローンフォルダ、銀行口座フォルダに配置されます)。これらのフォルダには、アプリケーションのセマンティクスをサポートする独自の独立したプロパティとアクセス制御があります。フォルダ階層内でドリルダウンして検索することも可能です。

ドキュメントへのアクセスを管理するための強力なガバナンスとコントロール

ドキュメント レベルとフォルダレベルでのきめ細かいアクセス制御(権限)をユーザーとグループに割り当てると、ドキュメントの表示、編集、管理(共有、削除)が可能になります。Document AI ウェアハウスは、Cloud Identity(IAM)や企業ディレクトリと統合して、ユーザーとグループを Cloud Identity にプロビジョニングできるようにします。ユーザーやグループは、Azure AD、Active Directory、Keycloak などのエンタープライズ LDAP / ID プロバイダや、Google Workspace アカウントから Cloud Identity に連携または同期することもできます。

他のクラウド、オンプレミス ストレージで Document AI を使用する

Document AI ウェアハウスは、高スループットのパイプライン(近日提供予定)を提供し、Storage Transfer Service を経由して Google Cloud Storage およびオンプレミス ファイル システムからのデータの転送、取り込み(DocAI を使用)、インデックス登録を行います。Google には、Microsoft SharePoint、Amazon S3、IBM FileNet といった他のリポジトリからこのパイプラインへのドキュメントの移行、同期、連携を支援するパートナーが揃っています。このプロダクトは、ドキュメントを Document AI ウェアハウスに移行したり、コンテンツの移行に制約がある場合にリポジトリに残したりすることができる柔軟なアーキテクチャをサポートしています(コンテンツや抽出またはタグ付きされたメタデータをインデックス登録します)。

柔軟なクラウド規模のドキュメント プラットフォーム

Document AI ウェアハウスは、インフラストラクチャのスケーリングを気にすることなく、現在のドキュメントとアーカイブのドキュメントの大きなリポジトリを管理し、ビジネスに合わせて柔軟にスケーリングします。最大数億件のドキュメントの検索、保存、更新と、毎秒最大数百のトランザクションの高スループット(Google Cloud の割り当て上限内)をサポートしています。

ドキュメント

ドキュメント

クイックスタート
クイックスタート: Document AI Warehouse API を設定する

このガイドでは、Google Cloud コンソールを使用して Document AI ウェアハウスの使用を開始するために必要なすべての設定手順を説明します。 

チュートリアル
Document AI ウェアハウスを使用して取り込み、処理、検索を行う

この Codelab では、サンプルの PDF ドキュメントと Document AI ウェアハウスのユーザー インターフェースを使用して、ドキュメントの取り込み、処理、検索を行う方法を学びます。

チュートリアル
ドキュメントをフォルダで整理する

フォルダは、ドキュメントのグループ化とラベル付けを行うためのコンテナとして機能します。このガイドでは、フォルダの概要と、フォルダを使用してドキュメントを管理する方法について説明します。  

Google Cloud の基礎
Document AI ウェアハウスの監査ロギング情報

このドキュメントでは、Cloud Audit Logs の一部として Document Warehouse によって作成される監査ログについて説明します。

ユースケース

ユースケース

ユースケース
Document AI の処理

Document AI ウェアハウスにより、ユーザーはスキャンされた PDF や TIFF または特殊なドキュメント タイプのいずれかをアップロードできます。どちらも、ドキュメントが Document AI ウェアハウスにインデックス登録される前に、それぞれ Document AI OCR または専用プロセッサによって自動的に抽出されます。注: OCR とその他のドキュメント抽出器は Document AI プロダクトで使用できますが、Document AI ウェアハウスには含まれていません。

ユースケース
バッチ Document AI パイプラインを管理する

Document AI ウェアハウスは、Workflows と統合して、Document AI の抽出と分類を通じて、ドキュメントのバッチ パイプラインを処理するテンプレートを提供します。注: これらの機能は、デプロイまたはカスタマイズできる外部オープンソース コンポーネントとスクリプトによって実現されます。Document AI ウェアハウス内には実装されていません。

ユースケース
ワークフローを定義して運用効率を改善する

Document AI ウェアハウスは、ワークフロー内のドキュメントの状態を表すプロパティと、ワークフローがドキュメントの状態を更新するために使用できる API をサポートすることで、ドキュメント処理ワークフローと統合します。Document Explorer のインターフェースを使用すると、ワークフロー パイプラインからドキュメントの進行状況を追跡できます。また、Pub/Sub トピックまたはウェブ API 呼び出しを介して、条件付き通知をトリガーすることもできます。

ユースケース
ドキュメントの検索と探索を行う

Document AI ウェアハウスにアップロードしたドキュメントは、全文検索できます。検索結果には、その検索キーワードを含むすべてのドキュメントと、その検索キーワードがハイライト表示されたドキュメント テキストの要約が表示されます。検索結果をプロパティ(日付、数値、列挙型、テキスト)でフィルタしたり、ルートフォルダ階層内で検索したりできます。さらに、ビジネスや業界に固有の類義語も使用できます。

料金

従量制の料金

Document AI ウェアハウスの料金は、一定期間にわたってインデックスに登録されたドキュメント数と API 呼び出しを行った回数の 2 つの消費指標に基づいています。料金は使用した分だけ請求されます。