事前トレーニングの概要

Document AI には、さまざまなユースケースの情報を取得するためにドキュメントを処理する複数のプロダクトが用意されています。

事前トレーニング済みパーサー

詳細については、事前トレーニング済みプロセッサを調べるをご覧ください。

銀行明細書パーサー

銀行明細書パーサーは Key-Value ペア(KVP)を抽出します。最大 17 個の一般的なエンティティを抽出できます。たとえば、口座番号、クライアント名、銀行名、入金や引き出しなどのテーブル項目があります。抽出するフィールド(スキーマ)を指定していません。銀行明細書パーサーは、エンリッチメント正規化をサポートしています。

W2 パーサー

W2 パーサーは、IRS Form W2 から KVP として抽出します。従業員の名前、社会保障番号、雇用主、賃金など、最大 12 個の一般的なエンティティを抽出できます。抽出するフィールド(スキーマ)を指定しません。W2 パーサーはエンリッチメントをサポートしています。

米国パスポート パーサー

米国パスポート パーサーが KVP を抽出します。最大 7 つの一般的なエンティティを抽出できます。これには、名、姓、書類 ID、生年月日が含まれます。抽出するフィールド(スキーマ)を指定しません。米国パスポート パーサーは正規化をサポートしています。

光熱費パーサー

光熱費明細書パーサーが KVP を抽出します。公共料金の請求書から最大 75 個の汎用エンティティを抽出できます。サプライヤー名、過去の支払額、金額、説明、商品コード、数量などの項目が含まれます。ユーティリティ パーサーでは、抽出するフィールド(スキーマ)を指定しません。

身分証明書パーサー

身分証明書パーサーは、複数のシグナルを使用して身分証明書の有効性を予測します。

  • fraud_signals_is_identity_document 検出: 画像に認識済みの身分証明書が含まれているかどうかを予測します。
  • fraud_signals_suspicious_words 検出: 身分証明書では一般的に使われない単語が存在するかどうかを予測します。
  • fraud_signals_image_manipulation 検出: 画像編集ツールで画像が変更または改ざんされたかどうかを予測します。
  • fraud_signals_online_duplicate 検出: 画像がオンラインで見つかるかどうかを予測します(米国のみ)。

支払い明細パーサー

支払い明細パーサーは KVP を抽出します。給与明細から最大 26 個の一般的なエンティティを抽出できます。これには、従業員の名前、ボーナス、コミッション、残業代、支払い日が含まれます。抽出するフィールド(スキーマ)を指定しません。給与明細パーサーは、エンリッチメント正規化をサポートしています。

米国運転免許証パーサー

米国運転免許証パーサーは KVP を抽出します。運転免許証から最大 8 個の一般的なエンティティを抽出できます。例: 名、姓、ドキュメント ID、有効期限。抽出するフィールド(スキーマ)を指定しません。米国運転免許証パーサーは正規化をサポートしています。

経費パーサー

経費パーサーが KVP を抽出します。経費精算書から最大 17 個の汎用エンティティを抽出できます。例: 費用の発生日、サプライヤー名、合計金額、通貨。抽出するフィールド(スキーマ)を指定しません。費用パーサーは、エンリッチメント正規化をサポートしています。

Invoice パーサー

Invoice パーサーは KVP を抽出します。請求書から最大 46 個の一般的なエンティティを抽出できます。請求書番号、サプライヤー名、請求額、税額、請求書の日付、期限などがあります。抽出するフィールド(スキーマ)を指定しません。Invoice Parser は、エンリッチメント正規化をサポートしています。

Summarizer

Summarizer は、短いドキュメントと長いドキュメントの概要と箇条書きの要約を作成します。要約ツールでは、要約の出力の長さを「包括的」、「中程度」、「簡潔」として指定することもできます。