ドキュメント プロセッサを作成して、面倒なタスクの自動化、データ抽出の改善、非構造化または構造化ドキュメント情報からのより詳細な分析情報の取得を支援します。Document AI を使用すると、デベロッパーはドキュメントの抽出、分類、分割を行う高精度プロセッサを作成できます。
新規のお客様には、Document AI やその他の Google Cloud プロダクトを試せる無料クレジット $300 分を差し上げます
Google が推奨する、生成 AI を活用した事前構築済みソリューションを使用して、サイズの大きなドキュメントを要約
BigQuery、Vertex Search、その他の Google Cloud プロダクトにシームレスに接続
エンタープライズ対応、Google Cloud のデータ セキュリティとプライバシーに対するコミットメント
デベロッパー向けに構築、UI または API を使用してドキュメント プロセッサを簡単に作成
利点
生成 AI を使用すると、すぐにデータの抽出やドキュメントの分類を行えます。使用し始めるのにトレーニングは必要はありません。エンタープライズ対応の API エンドポイントにドキュメントを送信するだけで、構造化データを取得できます。
Document AI は、ドキュメント タスク用に調整された最新の基盤モデルを活用しています。また、強力な微調整機能と自動ラベル付け機能により、必要な精度を達成するための複数のパスが用意されています。
ドキュメントから情報を構造化してデジタル化し、生成 AI を使用してより深い分析情報を引き出し、企業のより適切な意思決定を支援します。
デモ
生成 AI を使用してドキュメントからデータを抽出します。プロダクトのすべての機能については、Google Cloud コンソールで Document AI にアクセスしてください。
主な機能
Document AI Workbench を使用すると、ドキュメントから構造化データを分類、分割、抽出するカスタム プロセッサを簡単に構築できます。Workbench は生成 AI を搭載しているため、すぐに使用して、幅広いドキュメントで正確な結果を得ることができます。さらに、わずか 10 個のドキュメントを提供して大規模モデルを微調整することで、より高い精度を実現できます。これらはすべて、ボタンを 1 回クリックするか、1 つの API を呼び出すだけで実現できます。
今すぐ試すか、詳細をご覧ください。
Enterprise Document OCR を使用すると、Google が 25 年間にわたって行ってきた光学式文字認識(OCR)の研究にアクセスできます。OCR は、ビジネス ドキュメントでトレーニングされたモデルを利用しており、200 以上の言語で PDF 内のテキストやスキャンしたドキュメントの画像を検出できます。このプロダクトはドキュメントの構造を認識し、ブロック、段落、行、単語、記号などのレイアウト特性を識別できます。高度な機能には、最高水準の手書き入力認識(50 言語)、数式の認識、フォント スタイル情報の検出、チェックボックスやラジオボタンなどの選択マークの抽出などがあります。
テキストとレイアウトを正確に抽出するには、ドキュメント OCR をお試しください。
デベロッパーは、Form パーサーを使用して標準フォームからフィールドと値を取得し、名前、住所、価格などの汎用エンティティを抽出し、テーブルに含まれるデータを構造化できます。このプロダクトはすぐに使用でき、トレーニングやカスタマイズが不要で、ドキュメントの幅広いカスタマイズに役立ちます。
Form パーサーによるドキュメント処理について学ぶ。
W2、給与明細書、銀行の明細書、請求書、経費、米国の運転免許証、米国のパスポート、身分証明など、よく使用される種類のドキュメントに対して事前トレーニング済みモデルをお試しください。
プロセッサ ギャラリーで事前トレーニング済みオプションを確認する。
導入事例
Document AI は、不正行為の検出の改善、カスタマー サポートの自動化、臨床試験データの処理においてお客様を支援します。
最新情報
Google Cloud のニュースレターに登録して、サービスの最新情報、イベント情報、スペシャル オファーなどをお受け取りください。
ドキュメント
ビジネスニーズに固有のカスタム ML モデルを作成して、データを抽出してドキュメントを分類する方法を学びます。
ユースケース
Document AI Workbench を使用すると、ドキュメントから構造化データを抽出してデータ入力を自動化できます。一般的なアプリケーションには、郵便ルーム、出荷ヤード、住宅ローン処理部門、調達部門などがあります。このデータを使用して、より効率的かつ効果的なビジネス上の意思決定を行うことができます。
カスタム エクストラクタを試す。
ドキュメントからメタデータを直接 BigQuery オブジェクト テーブルに抽出できるようになりました。解析したデータを他の BigQuery テーブルとシームレスに結合して構造化データと非構造化データを結合し、包括的なドキュメント分析への道を開きます。
BigQuery と Document AI の統合について詳しくは、こちらをご覧ください。
ビジネス プロセスに流入するドキュメントにカテゴリやクラスを割り当てると、ドキュメントの管理、検索、フィルタ、分析が容易になります。カスタム スプリッターとカスタム分類器は、機械学習を使用して、ファイル内の単一または複数のドキュメントを正確に予測して分類します。これらのプロダクトを使用して、ドキュメント プロセスの効率を向上させます。
詳しくは、カスタム スプリッターとカスタム分類器をご覧ください。
SaaS のお客様と ISV パートナーは、生成 AI を使用してドキュメント処理ソリューションを迅速に改善、拡張できます。シンプルな API 予測エンドポイントとドキュメント レスポンス形式により、お客様はドキュメント アプリケーションを次のレベルに引き上げることができます。
Enterprise Document OCR を使用すると、通常であれば機械学習モデルのトレーニングには使用できないアーカイブ コンテンツから価値を生み出すことができます。OCR は、クラウド ストレージやデータ ウェアハウスに保存する前に、スキャンしたドキュメント、プロット、レポート、プレゼンテーションからテキストを抽出するのに役立ちます。これらの高品質の OCR 出力を使用して、ビジネスに特化した ML モデルのトレーニングなど、デジタル トランスフォーメーション イニシアチブを加速できます。
新しい生成 AI アーキテクチャとフレームワークのドキュメント情報を取得します。OCR と Vertex AI PaLM API を組み合わせることで、ユーザーはドキュメントから貴重なデータを抽出し、ドキュメントの Q&A エクスペリエンスの構築、ドキュメントの自動比較、さらには新しいドキュメントの生成を行うことができます。
料金
Document AI は、ドキュメント処理、モデルのトレーニング、ストレージのニーズのすべてに対応する、わかりやすく、費用対効果の高い料金体系になっています。詳しくは料金ページをご覧ください。
米ドル以外の通貨でお支払いの場合は、Google Cloud SKU に記載されている該当通貨の料金が適用されます。
Cloud AI プロダクトは、Google の SLA ポリシーに準拠しています。これらの SLA ポリシーで保証されているレイテンシや可用性は、他の Google Cloud サービスと異なる場合があります。