プロセッサのリスト

このページでは、Document AI で提供されるすべてのプロセッサの詳細について説明します。ソリューション タイプ別にプロセッサのリストを表示できます。

すべての Document AI プロセッサは、データ処理およびセキュリティ規約に準拠しています。

詳細については、プロセッサ バージョンの管理のドキュメントをご覧ください。また、プロダクト全体の割り当てと上限に加えて、プロセッサ固有の上限が適用されます。

テキストをデジタル化する

Enterprise Document OCR(光学式文字認識)

説明

さまざまなタイプのドキュメントでテキストを識別して抽出します。

このプロセッサを使用すると、200 を超える言語のドキュメントから、手書きテキストを含むテキストを識別して抽出できます。また、機械学習を使用して、コンテンツの読みやすさに基づいてドキュメントの品質評価を行います。

カテゴリ デジタル化
関数 OCR、品質分析
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API OCR_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
アフリカーンス語 af Latn
アルバニア語 sq Latn
アラビア語 ar Arab
アルメニア語 hy Armn
ベラルーシ語 be Cyrl
ベンガル語 bn Beng
ベンガル語 bn Beng
ブルガリア語 bg Cyrl
カタロニア語 ca Latn
中国語 zh Hani
クロアチア語 hr Latn
チェコ語 cs Latn
デンマーク語 da Latn
オランダ語 nl Latn
英語 en Latn
エストニア語 et Latn
フィリピン語 fil Latn
フィンランド語 fi Latn
フランス語 fr Latn
ドイツ語 de Latn
ギリシャ語 el Grek
グジャラート語 gu Gujr
ヘブライ語 iw Hebr
ヒンディー語 hi Deva
ハンガリー語 hu Latn
アイスランド語 is Latn
インドネシア語 id Latn
イタリア語 it Latn
日本語 ja Jpan
カンナダ語 kn Knda
クメール語 km Khmr
韓国語 ko Kore
ラオ語 lo Laoo
ラトビア語 lv Latn
リトアニア語 lt Latn
マケドニア語 mk Cyrl
マレー語 ms Latn
マラヤーラム語 ml Mlym
マラーティー語 mr Deva
ネパール語 ne Deva
ノルウェー語 no Latn
ペルシャ語 fa Arab
ポーランド語 pl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
パンジャブ語 pa Guru
ルーマニア語 ro Latn
ロシア語 ru Cyrl
セルビア語 sr Cyrl
スロバキア語 sk Latn
スロベニア語 sl Latn
スペイン語 es Latn
スウェーデン語 sv Latn
タガログ語 tl Latn
タミル語 ta Taml
テルグ語 te Telu
タイ語 th Thai
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-ocr-v1.0-2020-09-23 Stable

なし

なし

使用は推奨されず、米国(US)と欧州連合(EU)では 2025 年 4 月 30 日をもって廃止されます。
pretrained-ocr-v1.1-2022-09-12 Stable

なし

なし

使用は推奨されず、米国(US)と欧州連合(EU)では 2025 年 4 月 30 日をもって廃止されます。
pretrained-ocr-v1.2-2022-11-10 Stable

なし

なし

凍結されたモデル バージョン v1.0: コンテナ イメージに最大 18 か月間凍結されたバージョン スナップショットのモデルファイル、構成、バイナリ。
pretrained-ocr-v2.0-2023-06-02 Stable

なし

なし

ドキュメントのユースケースに特化した本番環境対応モデル。すべての OCR アドオンへのアクセスが含まれます。
pretrained-ocr-v2.1-2024-08-07 Stable

なし

なし

v2.1 の主な改善点は、印刷されたテキストの認識精度の向上、チェックボックスの検出精度の向上、読み取り順序の精度の向上です。
pretrained-ocr-v2.1.1-2025-01-31 リリース候補

なし

なし

v2.1.1 は v2.1 に似ており、USEUasia-southeast1 を除くすべてのリージョンで使用できます。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 500
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 Enterprise Document OCR

ドキュメントからエンティティを抽出します

トレーニングに使用するラベル付きデータセットとラベルなしデータセットのサンプルについては、サンプル データセットをご覧ください。

カスタム エクストラクタ

説明

生成 AI またはカスタムモデルを使用してドキュメントからフィールドを抽出します。モデルをファインチューニングして、ドキュメントからデータを正確に抽出します。

カテゴリ 抽出
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API CUSTOM_EXTRACTION_PROCESSOR
  • 抽出に生成 AI を使用する場合:

    • 公式にサポートされているのは英語のみです。
    • リージョンの可用性は、USEUnorthamerica-northeast1asia-southeast1 です。

サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
アフリカーンス語 af Latn
アラビア語 ar Arab
アゼルバイジャン語 az Latn
アゼルバイジャン語(キリル文字) az-Cyrl Cyrl
ベラルーシ語 be Cyrl
ブルガリア語 bg Cyrl
ボスニア語 bs Latn
カタロニア語 ca Latn
セブアノ語 ceb Latn
チェコ語 cs Latn
ウェールズ語 cy Latn
デンマーク語 da Latn
ドイツ語 de Latn
ギリシャ語 el Grek
英語 en Latn
エスペラント語 eo Latn
スペイン語 es Latn
エストニア語 et Latn
バスク語 eu Latn
ペルシャ語 fa Arab
フィンランド語 fi Latn
フィリピン語 fil Latn
フランス語 fr Latn
アイルランド語 ga Latn
ガリシア語 gl Latn
ヒンディー語 hi Deva
クロアチア語 hr Latn
クレオール語(ハイチ) ht Latn
ハンガリー語 hu Latn
インドネシア語 id Latn
アイスランド語 is Latn
イタリア語 it Latn
ヘブライ語 iw Hebr
日本語 ja Jpan
ジャワ語 jv Latn
カザフ語 kk Cyrl
韓国語 ko Kore
キルギス語 ky Cyrl
ラテン語 la Latn
リトアニア語 lt Latn
ラトビア語 lv Latn
マケドニア語 mk Cyrl
モンゴル語 mn Cyrl
マラーティー語 mr Deva
マレー語 ms Latn
マルタ語 mt Latn
ネパール語 ne Deva
オランダ語 nl Latn
ノルウェー語 no Latn
ポーランド語 pl Latn
パシュト語 ps Arab
ポルトガル語(ポルトガル、ブラジル) pt Latn
ルーマニア語 ro Latn
ロシア語 ru Cyrl
ロシア語(ペトリン正書法) ru-PETR1708 Cyrl
サンスクリット語 sa Deva
スロバキア語 sk Latn
スロベニア語 sl Latn
アルバニア語 sq Latn
セルビア語 sr Cyrl
スウェーデン語 sv Latn
スワヒリ語 sw Latn
タガログ語 tl Latn
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ウルドゥー語 ur Arab
ウズベク語 uz Latn
ウズベク語(キリル) uz-Cyrl Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
中国語(簡体) zh-Hans Hani
中国語(繁体) zh-Hant Hani
ズールー語 zu Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-foundation-model-v1.0-2023-08-22 Stable

なし

なし

専用のビジョンモデルと基盤モデルを活用し、ドキュメントのユースケースに特化した本番環境対応の候補モデル。
pretrained-foundation-model-v1.1-2024-03-12 リリース候補版

なし

なし

Gemini 1.0 Pro LLM と、専門の言語モデルやビジョン モデルなどの新しく開発されたテクノロジーを活用したリリース候補版。また、チェックボックスの検出などの高度な OCR 機能も含まれています。
pretrained-foundation-model-v1.2-2024-05-10 Stable

なし

なし

Gemini 1.5 Pro LLM と、専用の言語モデルや画像モデルなどの新しく開発されたテクノロジーを活用した本番環境対応の候補。また、チェックボックスの検出などの高度な OCR 機能も含まれています。サポートされている最大のトークン数の上限を使用する場合や、新しいモデルをテストする場合におすすめします。
pretrained-foundation-model-v1.3-2024-08-31 Stable

なし

なし

Gemini 1.5 Flash LLM を搭載した本番環境対応の候補版。また、チェックボックスの検出などの高度な OCR 機能も備えています。レイテンシを最小限に抑えたい方におすすめです。
pretrained-foundation-model-v1.4-2025-02-05 リリース候補版

なし

なし

Gemini 2.0 Flash LLM を搭載した本番環境対応の候補。Gemini 2.0 Flash LLM を搭載した本番環境対応の候補。また、チェックボックスの検出などの高度な OCR 機能も含まれています。新しいモデルを試したい方におすすめです。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
正規化されたデータ型

詳細については、拡充と正規化データセットを作成するをご覧ください。

正規化されたデータ型の完全なリスト
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 カスタム エクストラクタ

Form パーサー

説明

OCR テキストだけでなく、一般的な Key-Value ペア(エンティティとチェックボックス)、テーブル、汎用エンティティをドキュメントから抽出します。

このプロセッサは、高度な ML テクノロジーを使用して、200 を超える言語のドキュメントから Key-Value ペア、チェックボックス、表を抽出します。このプロセッサは、ディープ ラーニング モデルを利用して、さまざまなドキュメント タイプに共通する 11 個の汎用エンティティも抽出します。

カテゴリ 抽出
関数 OCR、フォーム解析、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API FORM_PARSER_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
アフリカーンス語 af Latn
アルバニア語 sq Latn
アラビア語 ar Arab
ベラルーシ語 be Cyrl
カタロニア語 ca Latn
中国語 zh Hani
クロアチア語 hr Latn
チェコ語 cs Latn
デンマーク語 da Latn
オランダ語 nl Latn
英語 en Latn
エストニア語 et Latn
フィリピン語 fil Latn
フィンランド語 fi Latn
フランス語 fr Latn
ドイツ語 de Latn
ヘブライ語 iw Hebr
ヒンディー語 hi Deva
ハンガリー語 hu Latn
アイスランド語 is Latn
インドネシア語 id Latn
イタリア語 it Latn
日本語 ja Jpan
韓国語 ko Kore
ラトビア語 lv Latn
リトアニア語 lt Latn
マケドニア語 mk Cyrl
マレー語 ms Latn
マラーティー語 mr Deva
ネパール語 ne Deva
ノルウェー語 no Latn
ペルシャ語 fa Arab
ポーランド語 pl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
ルーマニア語 ro Latn
ロシア語 ru Cyrl
セルビア語 sr Cyrl
スロバキア語 sk Latn
スロベニア語 sl Latn
スペイン語 es Latn
スウェーデン語 sv Latn
タガログ語 tl Latn
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-form-parser-v1.0-2020-09-23 Stable

なし

なし

以前のバージョン。最適な品質と完全な機能セットを実現するには、Form Parser v2.0 を使用してください。
pretrained-form-parser-v2.0-2022-11-10 Stable
フィールドを表示する
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number

なし

推奨バージョン。汎用エンティティをサポートし、アップグレードされたテーブル、KVP、チェックボックス モデル、200 を超える言語が含まれています。
pretrained-form-parser-v2.1-2023-06-26 リリース候補版

なし

なし

公開プレビュー版。デジタル PDF ファイルからのネイティブ テキスト抽出が有効になっている v2.0 と同じモデルです。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 100
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 Form パーサー

レイアウト パーサー

説明

ドキュメントのコンテンツ要素(テキスト、表、リスト)を抽出し、コンテキスト アウェア チャンクを作成します。

レイアウト パーサーは、テキスト、表、リストなどのドキュメント コンテンツ要素を抽出し、生成 AI や検索アプリケーションでの情報検索を容易にするコンテキスト アウェア チャンクを作成します。

カテゴリ 抽出
関数 レイアウト解析、ドキュメント チャンキング
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API LAYOUT_PARSER_PROCESSOR
  • このパーサーは、PDF、HTML、DOCX ファイルをサポートしています。
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
アフリカーンス語 af Latn
アルバニア語 sq Latn
アラビア語 ar Arab
アルメニア語 hy Armn
ベラルーシ語 be Cyrl
ベンガル語 bn Beng
ベンガル語 bn Beng
ブルガリア語 bg Cyrl
カタロニア語 ca Latn
中国語 zh Hani
クロアチア語 hr Latn
チェコ語 cs Latn
デンマーク語 da Latn
オランダ語 nl Latn
英語 en Latn
エストニア語 et Latn
フィリピン語 fil Latn
フィンランド語 fi Latn
フランス語 fr Latn
ドイツ語 de Latn
ギリシャ語 el Grek
グジャラート語 gu Gujr
ヘブライ語 iw Hebr
ヒンディー語 hi Deva
ハンガリー語 hu Latn
アイスランド語 is Latn
インドネシア語 id Latn
イタリア語 it Latn
日本語 ja Jpan
カンナダ語 kn Knda
クメール語 km Khmr
韓国語 ko Kore
ラオ語 lo Laoo
ラトビア語 lv Latn
リトアニア語 lt Latn
マケドニア語 mk Cyrl
マレー語 ms Latn
マラヤーラム語 ml Mlym
マラーティー語 mr Deva
ネパール語 ne Deva
ノルウェー語 no Latn
ペルシャ語 fa Arab
ポーランド語 pl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
パンジャブ語 pa Guru
ルーマニア語 ro Latn
ロシア語 ru Cyrl
セルビア語 sr Cyrl
スロバキア語 sk Latn
スロベニア語 sl Latn
スペイン語 es Latn
スウェーデン語 sv Latn
タガログ語 tl Latn
タミル語 ta Taml
テルグ語 te Telu
タイ語 th Thai
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-layout-parser-v1.0-2024-06-03 Stable

なし

なし

推奨バージョン。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 500
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us
詳細 レイアウト パーサー

事前トレーニング済みプロセッサを確認する

銀行明細書パーサー

説明

名前、口座、取引などの情報を銀行の明細書から抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API BANK_STATEMENT_PROCESSOR
  • 複数ページの入力ファイルのページが正しいドキュメント タイプで、サポートされているバージョンのいずれかである場合、プロセッサはサポートされている最初のドキュメントに対してエンティティ抽出を行います。入力ファイルに該当するドキュメントが見つからない場合、プロセッサはエラー メッセージを返します。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-bankstatement-v1.0-2021-08-08 Stable

なし

なし

pretrained-bankstatement-v1.1-2021-08-13 Stable

なし

なし

pretrained-bankstatement-v2.0-2021-12-10 Stable

なし

なし

pretrained-bankstatement-v3.0-2022-05-16 Stable

なし

なし

このバージョンでは、入力ファイルに単一の銀行明細書が含まれていることを前提としています。デフォルト バージョンとは異なり、このバージョンでは銀行の明細書が入力ファイルにないかチェックされず、銀行の明細書が見つからない場合でもエラーは返されません。
pretrained-bankstatement-v4.0-2023-07-31 リリース候補版

なし

なし

pretrained-bankstatement-v5.0-2023-12-06 リリース候補版

なし

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 30
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧
  • bank_address
  • bank_name
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
アップトレーニング
人間参加型
ラベル付け手順 [新しいウィンドウで開く] を選択します。
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

W2 パーサー

説明

Form W2 から従業員、雇用主、賃金などを抽出

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API FORM_W2_PROCESSOR
  • 複数ページの入力ファイルのページが正しいドキュメント タイプで、サポートされているバージョンのいずれかである場合、プロセッサはサポートされている最初のドキュメントに対してエンティティ抽出を行います。入力ファイルに該当するドキュメントが見つからない場合、プロセッサはエラー メッセージを返します。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
サポートされているフォーム/バージョン
  • 2020(標準版とカスタマイズ版)
  • 2019(標準版とカスタマイズ版)
  • 2018(標準版とカスタマイズ版)
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-w2-v1.0-2020-10-01 Stable

なし

なし

pretrained-w2-v1.1-2022-01-27 Stable

なし

なし

pretrained-w2-v1.2-2022-01-28 Stable
フィールドを表示する
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

なし

品質の改善と新しいフィールドのサポート。分割ツールは含まれません。

pretrained-w2-v2.0-2022-03-30 リリース候補版
フィールドを表示する
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

なし

品質の改善、ボックス 12 フィールドのサポート、EmployeeNameEmployeeAddressEmployerNameAndAddress のきめ細かい予測。これらのフィールドはすべて出力の一部ではなくなり、追加のフィールドに置き換えられます。

pretrained-w2-v2.1-2022-06-08 Stable
フィールドを表示する
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

なし

バージョン pretrained-w2-v2.0-2022-03-30 に似ていますが、品質がさらに向上し、エンティティ EmployeeName_Suffix が 1 つ追加されています。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 15
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧
  • EmployerNameAndAddress
  • EIN
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

米国パスポート パーサー

説明

名前、ドキュメント ID、生年月日などのフィールドを抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API US_PASSPORT_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-us-passport-v1.0-2021-06-14 Stable

なし

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • Date Of Birth
  • Expiration Date
  • Issue Date
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

光熱費パーサー

説明

公共料金の請求書からテキストと値(サプライヤー名や過去の支払額など)を抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 制限付き [*]
Type in API UTILITY_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-utility-v1.1-2021-04-09 Stable

なし

なし

pretrained-utility-v1.2-2022-12-15 リリース候補版

なし

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 10
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
アップトレーニング
人間参加型
ラベル付け手順 [新しいウィンドウで開く] を選択します。
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

身分証明書パーサー

説明

複数のシグナルを使用して身分証明書の有効性を予測します。

身分証明書の証明プロセッサは、次の 4 つのシグナルを使用して身分証明書の有効性を予測できるように設計されています。

現在、プロセッサは次のシグナルから情報を返します。

  • fraud_signals_is_identity_document 検出: 画像に認識済みの身分証明書が含まれているかどうかを予測します。
  • fraud_signals_suspicious_words 検出: 身分証明書では一般的に使われない単語が存在するかどうかを予測します。
  • fraud_signals_image_manipulation 検出: 画像編集ツールで画像が変更または改ざんされたかどうかを予測します。
  • fraud_signals_online_duplicate 検出: 画像がオンラインで見つかるかどうかを予測します(米国のみ)。

カテゴリ トレーニング済み
関数 OCR、品質分析
リリース ステージ プレビュー
アクセス ステータス 公開
Type in API ID_PROOFING_PROCESSOR
  • 現在、オンライン重複検出機能は米国のデータセンターで処理されています。米国以外では、この機能のリージョンとマルチリージョンのサポートは利用できません。
  • このプロセッサは、新しいプロセッサ バージョンのリリースよりも頻繁に更新されるアルゴリズムによってサポートされています。このため、同じプロセッサ バージョンを使用している場合でも、プロセッサから返される出力が時間の経過とともに異なる場合があります。たとえば、オンライン重複検出システムは、ウェブ上の画像をモニタリングします。プロセッサのバージョンで追跡できるよりも速く、システムの動作が変化する可能性があります。
  • 責任ある AI に関する注意事項[†]と人間による審査[‡]を参照してください。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
サポートされているフォーム/バージョン
  • 米国のパスポート、パスカード、運転免許証のサポート。
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-id-proofing-v1.0-2022-10-03 Stable

なし

なし

pretrained-id-proofing-v1.1-2023-05-18 リリース候補版
フィールドを表示する
  • fraud_signals_photocopy_detection

なし

追加のコピー検出シグナル

pretrained-id-proofing-v1.2-2023-10-04 リリース候補版
フィールドを表示する
  • fraud_signals_photocopy_detection

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

支払い明細パーサー

説明

給与明細から名前、ビジネス、金額などを抽出します

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API PAYSTUB_PROCESSOR
  • 複数ページの入力ドキュメントに複数の有効な給与明細書が含まれている場合、最初の有効な給与明細書からのみエンティティが抽出されます。入力ファイルに給与明細が見つからない場合、プロセッサはエラー メッセージを返します。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-paystub-v1.0-2021-03-19 Stable

なし

なし

pretrained-paystub-v1.1-2021-08-13 Stable
フィールドを表示する
  • net_pay
  • net_pay_ytd
  • employee_account_number

なし

品質の改善と新しいフィールドのサポート。
pretrained-paystub-v1.2-2021-12-10 Stable

なし

なし

pretrained-paystub-v2.0-2022-05-17 リリース候補版
フィールドを表示する
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

なし

このバージョンでは、入力ファイルに単一の給与明細書が含まれていることを前提としています。デフォルト バージョンとは異なり、このバージョンでは給与明細書が入力ファイルにないかチェックされず、給与明細書が見つからない場合でもエラーは返されません。

品質の向上、新しいフィールドのサポート、新しいスキーマ。ボーナス、コミッション、休日、残業、基本給、有給休暇が earning_item/earning_this_period に含まれるようになりました。これらの年初来バージョンは earning_item/earning_ytd にあります。直接入金と従業員の口座番号が direct_deposit_item の下にネストされるようになりました。

非同期ページの上限は 10 です。

pretrained-paystub-v2.0-2022-07-22 Stable

なし

なし

品質の改善とアップトレーニングの強化。

pretrained-paystub-v3.0-2023-12-06 リリース候補版

なし

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 50
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧
  • employer_address
  • employer_name
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
アップトレーニング
人間参加型
ラベル付け手順 [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

米国運転免許証パーサー

説明

名前、ドキュメント ID、生年月日などのフィールドを抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API US_DRIVER_LICENSE_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
サポートされているフォーム/バージョン
  • 50 州すべてとワシントン DC をサポート。
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-us-driver-license-v1.0-2021-06-14 Stable

なし

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • Date Of Birth
  • Expiration Date
  • Issue Date
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • eu
  • us

経費パーサー

説明

費用に関するドキュメントから、費用の日付、サプライヤー名、合計金額、通貨などのテキストと値を抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API EXPENSE_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
ドイツ語 de Latn
英語 en Latn
スペイン語 es Latn
フランス語 fr Latn
日本語 ja Jpan
オランダ語 nl Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-expense-v1.1-2021-04-09 Stable

なし

なし

2021 年 4 月にリリースされました。まもなくサポートが終了する予定です。
pretrained-expense-v1.2-2022-02-18 Stable

なし

なし

pretrained-expense-v1.3-2022-07-15 Stable
フィールドを表示する
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: 日本語
ホテルとレンタカーのフォリオのサポート。
pretrained-expense-v1.3.2-2024-09-11 リリース候補版
フィールドを表示する
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: 日本語
基盤となるビジョン モデルが強化された v1.3 へのアップグレード。
pretrained-expense-v1.4-2022-11-18 リリース候補版
フィールドを表示する
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 日本語
  • it: イタリア語
  • pt: ポルトガル語(ポルトガルとブラジル)
パフォーマンスの改善とアップトレーニングのサポート。最大ページ数(オンライン/同期リクエスト)の上限が 15 に引き上げられました。
pretrained-expense-v1.4.2-2024-09-12 リリース候補版
フィールドを表示する
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 日本語
  • it: イタリア語
  • pt: ポルトガル語(ポルトガルとブラジル)
基盤となるビジョン モデルが強化された v1.4 へのアップグレード。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 10
最大ページ数(バッチ/オフライン/非同期リクエスト): 10
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧
  • supplier_address
  • supplier_name
  • supplier_phone
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
アップトレーニング
人間参加型
ラベル付け手順 [新しいウィンドウで開く] を選択します。
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Invoice パーサー

説明

請求書からテキストと値(請求書番号、サプライヤー名、請求額、税額、請求書の日付、期限など)を抽出します。

請求書 Parser は、請求書番号、サプライヤー名、請求額、税額、請求日、期限、項目の金額など、ヘッダーと項目の両方のフィールドを抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API INVOICE_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
ドイツ語 de Latn
英語 en Latn
スペイン語 es Latn
エストニア語 et Latn
フランス語 fr Latn
イタリア語 it Latn
ラトビア語 lv Latn
リトアニア語 lt Latn
オランダ語 nl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
ルーマニア語 ro Latn
スウェーデン語 sv Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-invoice-v1.1-2021-04-09 Stable

なし

なし

pretrained-invoice-v1.2-2022-02-18 Stable

なし

なし

まもなく非推奨になる予定です。
pretrained-invoice-v1.3-2022-07-15 Stable

なし

  • it: イタリア語
  • pt: ポルトガル語(ポルトガルとブラジル)
  • ro: ルーマニア語
  • sv: スウェーデン語
  • et: エストニア語
  • lv: ラトビア語
  • lt: リトアニア語
アップトレーニング可能なプロセッサ バージョン。最大ページ数(オンライン/同期リクエスト)が 15 に増加しました。
pretrained-invoice-v1.4-2022-10-21 リリース候補版

なし

なし

アップトレーニング可能なプロセッサ バージョン。最大ページ数(オンライン/同期リクエスト)が 15 に増加しました。
pretrained-invoice-v1.5-2023-09-15 リリース候補版

なし

なし

pretrained-invoice-v2.0-2023-12-06 リリース候補版

なし

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧
  • supplier_address
  • supplier_name
  • supplier_phone
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
アップトレーニング
人間参加型
ラベル付け手順 [新しいウィンドウで開く] を選択します。
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

ドキュメントを分類する

カスタム分類器

説明

一連のクラスからドキュメント タイプを分類するモデルをトレーニングします。

カテゴリ 分類
関数 OCR、分類
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API CUSTOM_CLASSIFICATION_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 カスタム分類プロセッサを作成する

カスタム スプリッター

説明

複数のドキュメントを含むファイルを個別の分類されたドキュメントに分割するようにモデルをトレーニングします。

カテゴリ 分類
関数 OCR、分類、分割
リリース ステージ 一般提供
アクセス ステータス 公開
Type in API CUSTOM_SPLITTING_PROCESSOR
  • i18n は、カスタム トレーニング オプションでのみサポートできます。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 1000
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 カスタム スプリッター プロセッサを作成する

ドキュメントを要約する

Summarizer

説明

短いドキュメントと長いドキュメントの概要や箇条書きの要約を取得します。

カテゴリ 事前トレーニング済み
関数 要約
リリース ステージ プレビュー
アクセス ステータス 公開
Type in API SUMMARY_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力のサポート
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-foundation-model-v1.0-2023-08-22 Stable

なし

なし

Google の基盤モデル

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 250
アップトレーニング
人間参加型
サンプル入力ファイル [新しいウィンドウで開く] を選択します。
出力例: [新しいウィンドウで開く] を選択します。
サポートされているリージョン
  • us
詳細 カスタム サマライザー

脚注

[*] このプロセッサは、一部のお客様にのみアクセスが制限されています。

API アクセスをリクエストするには、Document AI の制限付きアクセスお客様リクエスト フォームに必要事項を記入してお送りください。このフォームには、お客様、お客様が所属している会社、用途に関する情報を入力する必要があります。アクセスには Google Cloud プロジェクト ID が必要です。新しい Google Cloud プロジェクトを作成するか、既存のプロジェクトのプロジェクト ID を確認する場合は、こちらの手順をご覧ください。

フォームを送信すると、Document AI チームがお客様のリクエストを審査し、お客様がアクセス基準を満たしているかどうか確認いたします。アクセスが承認されると、この機能のアクセス方法と使用方法を説明するメールが届きます。

[†] 身分証明書の検証は、入力画像が本物の身分証明書を表すかどうかを特定するために役立つ身分証明書から情報を抽出して評価します。

Google Cloudでは、お客様が AI ソリューションを安全に開発、実装できるよう支援することを最優先としています。身元確認は、Google の AI 原則に従って開発されています。

Google の AI に関する原則と現在のプロダクト設計に基づき、以下のような場合に身分証明書の確認を使用する場合は、慎重に検討し、潜在的なメリットとリスクを慎重に評価することを強くおすすめします。

  • 人権に影響を与える可能性がある予測について、人間が関与しない意思決定を行う。
  • 雇用、公共サービスへのアクセス、ヘルスケア、安全性上重要なコンテキストなど、機密性の高いドメイン(ただしこれらに限定されません)。

[‡] 身元確認は、より広範な身元確認プロセスとワークフローの一部として常に使用してください。 ワークフローに人間の審査担当者を配置して、予測されたシグナルが正確かどうかを確認することが重要です。本人確認プロセッサは、ワークフローで ID の人間による確認に代わるものではありません。人間の審査担当者が身分証明書を検証する際に役立つものです。身分証明書の有効性を確認する自動判断ツールとして、身分証明書確認プロセッサを使用しないでください。人間による審査により、ドキュメント処理の精度を高めることができます。また、人間による審査用の専用ツールを使用して予測を評価することもできます。

このテクノロジーを導入する地域の規制を必ず確認し、既存の業界ガイダンスを調査して、ポリシー ガイドラインと一般的な公平性の問題を把握してください。トレーニング用データセットのバイアス軽減、パフォーマンスの不均衡に関するカスタムモデルの評価、カスタムモデルを利用する際に検討すべき事項など、機械学習における公平性について学びます。

お客様には、本人確認を実装する際に、公平性、解釈可能性、プライバシー、セキュリティのベスト プラクティスを念頭に置くことをおすすめします。責任ある AI を実装する方法について詳しくは、Google の責任ある AI への取り組みに関する推奨事項をご覧ください。

ユースケースとサンプル アプリケーション コード リポジトリの詳細については、ブログ投稿の Document AI で身分証明書の処理を自動化をご覧ください。