このページは Cloud Translation API によって翻訳されました。

プロセッサのリスト

このページでは、Document AI で提供されるすべてのプロセッサの詳細について説明します。ソリューションタイプ別にプロセッサのリストを表示できます。

すべての Document AI プロセッサは、データ処理およびセキュリティ規約に準拠しています。

詳細については、プロセッサバージョンの管理のドキュメントをご覧ください。また、プロダクト全体の割り当てと上限に加えて、プロセッサ固有の上限が適用されます。

テキストをデジタル化する

Enterprise Document OCR（光学式文字認識）

説明

さまざまなタイプのドキュメントでテキストを識別して抽出します。

このプロセッサを使用すると、200 を超える言語のドキュメントから、手書きテキストを含むテキストを識別して抽出できます。また、機械学習を使用して、コンテンツの読みやすさに基づいてドキュメントの品質評価を行います。

カテゴリ デジタル化

関数 OCR、品質分析

リリースステージ 一般提供

アクセスステータス 公開

Type in API OCR_PROCESSOR

サポートされている言語

言語の完全なリスト

言語名	BCP 47 タグ	スクリプト
アフリカーンス語	`af`	`Latn`
アルバニア語	`sq`	`Latn`
アラビア語	`ar`	`Arab`
アルメニア語	`hy`	`Armn`
ベラルーシ語	`be`	`Cyrl`
ベンガル語	`bn`	`Beng`
ベンガル語	`bn`	`Beng`
ブルガリア語	`bg`	`Cyrl`
カタロニア語	`ca`	`Latn`
中国語	`zh`	`Hani`
クロアチア語	`hr`	`Latn`
チェコ語	`cs`	`Latn`
デンマーク語	`da`	`Latn`
オランダ語	`nl`	`Latn`
英語	`en`	`Latn`
エストニア語	`et`	`Latn`
フィリピン語	`fil`	`Latn`
フィンランド語	`fi`	`Latn`
フランス語	`fr`	`Latn`
ドイツ語	`de`	`Latn`
ギリシャ語	`el`	`Grek`
グジャラート語	`gu`	`Gujr`
ヘブライ語	`iw`	`Hebr`
ヒンディー語	`hi`	`Deva`
ハンガリー語	`hu`	`Latn`
アイスランド語	`is`	`Latn`
インドネシア語	`id`	`Latn`
イタリア語	`it`	`Latn`
日本語	`ja`	`Jpan`
カンナダ語	`kn`	`Knda`
クメール語	`km`	`Khmr`
韓国語	`ko`	`Kore`
ラオ語	`lo`	`Laoo`
ラトビア語	`lv`	`Latn`
リトアニア語	`lt`	`Latn`
マケドニア語	`mk`	`Cyrl`
マレー語	`ms`	`Latn`
マラヤーラム語	`ml`	`Mlym`
マラーティー語	`mr`	`Deva`
ネパール語	`ne`	`Deva`
ノルウェー語	`no`	`Latn`
ペルシャ語	`fa`	`Arab`
ポーランド語	`pl`	`Latn`
ポルトガル語（ポルトガル、ブラジル）	`pt`	`Latn`
パンジャブ語	`pa`	`Guru`
ルーマニア語	`ro`	`Latn`
ロシア語	`ru`	`Cyrl`
セルビア語	`sr`	`Cyrl`
スロバキア語	`sk`	`Latn`
スロベニア語	`sl`	`Latn`
スペイン語	`es`	`Latn`
スウェーデン語	`sv`	`Latn`
タガログ語	`tl`	`Latn`
タミル語	`ta`	`Taml`
テルグ語	`te`	`Telu`
タイ語	`th`	`Thai`
トルコ語	`tr`	`Latn`
ウクライナ語	`uk`	`Cyrl`
ベトナム語	`vi`	`Latn`
イディッシュ語	`yi`	`Hebr`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-ocr-v1.0-2020-09-23`	Stable	なし	なし	使用は推奨されず、米国（US）と欧州連合（EU）では 2025 年 4 月 30 日をもって廃止されます。
`pretrained-ocr-v1.1-2022-09-12`	Stable	なし	なし	使用は推奨されず、米国（US）と欧州連合（EU）では 2025 年 4 月 30 日をもって廃止されます。
`pretrained-ocr-v1.2-2022-11-10`	Stable	なし	なし	凍結されたモデルバージョン v1.0: コンテナイメージに最大 18 か月間凍結されたバージョンスナップショットのモデルファイル、構成、バイナリ。
`pretrained-ocr-v2.0-2023-06-02`	Stable	なし	なし	ドキュメントのユースケースに特化した本番環境対応モデル。すべての OCR アドオンへのアクセスが含まれます。
`pretrained-ocr-v2.1-2024-08-07`	Stable	なし	なし	v2.1 の主な改善点は、印刷されたテキストの認識精度の向上、チェックボックスの検出精度の向上、読み取り順序の精度の向上です。
`pretrained-ocr-v2.1.1-2025-01-31`	リリース候補	なし	なし	v2.1.1 は v2.1 に似ており、`US`、`EU`、`asia-southeast1` を除くすべてのリージョンで使用できます。

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	500

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

詳細 Enterprise Document OCR

ドキュメントからエンティティを抽出します

トレーニングに使用するラベル付きデータセットとラベルなしデータセットのサンプルについては、サンプルデータセットをご覧ください。

カスタムエクストラクタ

説明

生成 AI またはカスタムモデルを使用してドキュメントからフィールドを抽出します。モデルをファインチューニングして、ドキュメントからデータを正確に抽出します。

カテゴリ 抽出

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API CUSTOM_EXTRACTION_PROCESSOR

注

抽出に生成 AI を使用する場合:
- 公式にサポートされているのは英語のみです。
- リージョンの可用性は、US、EU、northamerica-northeast1、asia-southeast1 です。

サポートされている言語

言語の完全なリスト

言語名	BCP 47 タグ	スクリプト
アフリカーンス語	`af`	`Latn`
アラビア語	`ar`	`Arab`
アゼルバイジャン語	`az`	`Latn`
アゼルバイジャン語（キリル文字）	`az-Cyrl`	`Cyrl`
ベラルーシ語	`be`	`Cyrl`
ブルガリア語	`bg`	`Cyrl`
ボスニア語	`bs`	`Latn`
カタロニア語	`ca`	`Latn`
セブアノ語	`ceb`	`Latn`
チェコ語	`cs`	`Latn`
ウェールズ語	`cy`	`Latn`
デンマーク語	`da`	`Latn`
ドイツ語	`de`	`Latn`
ギリシャ語	`el`	`Grek`
英語	`en`	`Latn`
エスペラント語	`eo`	`Latn`
スペイン語	`es`	`Latn`
エストニア語	`et`	`Latn`
バスク語	`eu`	`Latn`
ペルシャ語	`fa`	`Arab`
フィンランド語	`fi`	`Latn`
フィリピン語	`fil`	`Latn`
フランス語	`fr`	`Latn`
アイルランド語	`ga`	`Latn`
ガリシア語	`gl`	`Latn`
ヒンディー語	`hi`	`Deva`
クロアチア語	`hr`	`Latn`
クレオール語（ハイチ）	`ht`	`Latn`
ハンガリー語	`hu`	`Latn`
インドネシア語	`id`	`Latn`
アイスランド語	`is`	`Latn`
イタリア語	`it`	`Latn`
ヘブライ語	`iw`	`Hebr`
日本語	`ja`	`Jpan`
ジャワ語	`jv`	`Latn`
カザフ語	`kk`	`Cyrl`
韓国語	`ko`	`Kore`
キルギス語	`ky`	`Cyrl`
ラテン語	`la`	`Latn`
リトアニア語	`lt`	`Latn`
ラトビア語	`lv`	`Latn`
マケドニア語	`mk`	`Cyrl`
モンゴル語	`mn`	`Cyrl`
マラーティー語	`mr`	`Deva`
マレー語	`ms`	`Latn`
マルタ語	`mt`	`Latn`
ネパール語	`ne`	`Deva`
オランダ語	`nl`	`Latn`
ノルウェー語	`no`	`Latn`
ポーランド語	`pl`	`Latn`
パシュト語	`ps`	`Arab`
ポルトガル語（ポルトガル、ブラジル）	`pt`	`Latn`
ルーマニア語	`ro`	`Latn`
ロシア語	`ru`	`Cyrl`
ロシア語（ペトリン正書法）	`ru-PETR1708`	`Cyrl`
サンスクリット語	`sa`	`Deva`
スロバキア語	`sk`	`Latn`
スロベニア語	`sl`	`Latn`
アルバニア語	`sq`	`Latn`
セルビア語	`sr`	`Cyrl`
スウェーデン語	`sv`	`Latn`
スワヒリ語	`sw`	`Latn`
タガログ語	`tl`	`Latn`
トルコ語	`tr`	`Latn`
ウクライナ語	`uk`	`Cyrl`
ウルドゥー語	`ur`	`Arab`
ウズベク語	`uz`	`Latn`
ウズベク語（キリル）	`uz-Cyrl`	`Cyrl`
ベトナム語	`vi`	`Latn`
イディッシュ語	`yi`	`Hebr`
中国語（簡体）	`zh-Hans`	`Hani`
中国語（繁体）	`zh-Hant`	`Hani`
ズールー語	`zu`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-foundation-model-v1.0-2023-08-22`	Stable	なし	なし	専用のビジョンモデルと基盤モデルを活用し、ドキュメントのユースケースに特化した本番環境対応の候補モデル。注: 2025 年 4 月 9 日より、このバージョンにアクセスできなくなります。
`pretrained-foundation-model-v1.1-2024-03-12`	リリース候補版	なし	なし	Gemini 1.0 Pro LLM と、専門の言語モデルやビジョンモデルなどの新しく開発されたテクノロジーを活用したリリース候補版。また、チェックボックスの検出などの高度な OCR 機能も含まれています。注: 2025 年 4 月 9 日より、このバージョンにアクセスできなくなります。
`pretrained-foundation-model-v1.2-2024-05-10`	Stable	なし	なし	Gemini 1.5 Pro LLM と、専用の言語モデルや画像モデルなどの新しく開発されたテクノロジーを活用した本番環境対応の候補。また、チェックボックスの検出などの高度な OCR 機能も含まれています。サポートされている最大のトークン数の上限を使用する場合や、新しいモデルをテストする場合におすすめします。
`pretrained-foundation-model-v1.3-2024-08-31`	Stable	なし	なし	Gemini 1.5 Flash LLM を搭載した本番環境対応の候補版。また、チェックボックスの検出などの高度な OCR 機能も含まれています。レイテンシを最小限に抑えたい方におすすめです。
`pretrained-foundation-model-v1.4-2025-02-05`	リリース候補版	なし	なし	Gemini 2.0 Flash LLM を搭載した本番環境対応の候補。Gemini 2.0 Flash LLM を搭載した本番環境対応の候補。また、チェックボックスの検出などの高度な OCR 機能も含まれています。新しいモデルを試したい方におすすめです。

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	200

正規化されたデータ型

詳細については、拡充と正規化とデータセットを作成するをご覧ください。

正規化されたデータ型の完全なリスト

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

詳細カスタムエクストラクタ

Form パーサー

説明

OCR テキストだけでなく、一般的な Key-Value ペア（エンティティとチェックボックス）、テーブル、汎用エンティティをドキュメントから抽出します。

このプロセッサは、高度な ML テクノロジーを使用して、200 を超える言語のドキュメントから Key-Value ペア、チェックボックス、表を抽出します。このプロセッサは、ディープラーニングモデルを利用して、さまざまなドキュメントタイプに共通する 11 個の汎用エンティティも抽出します。

カテゴリ 抽出

関数 OCR、フォーム解析、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API FORM_PARSER_PROCESSOR

サポートされている言語

言語の完全なリスト

言語名	BCP 47 タグ	スクリプト
アフリカーンス語	`af`	`Latn`
アルバニア語	`sq`	`Latn`
アラビア語	`ar`	`Arab`
ベラルーシ語	`be`	`Cyrl`
カタロニア語	`ca`	`Latn`
中国語	`zh`	`Hani`
クロアチア語	`hr`	`Latn`
チェコ語	`cs`	`Latn`
デンマーク語	`da`	`Latn`
オランダ語	`nl`	`Latn`
英語	`en`	`Latn`
エストニア語	`et`	`Latn`
フィリピン語	`fil`	`Latn`
フィンランド語	`fi`	`Latn`
フランス語	`fr`	`Latn`
ドイツ語	`de`	`Latn`
ヘブライ語	`iw`	`Hebr`
ヒンディー語	`hi`	`Deva`
ハンガリー語	`hu`	`Latn`
アイスランド語	`is`	`Latn`
インドネシア語	`id`	`Latn`
イタリア語	`it`	`Latn`
日本語	`ja`	`Jpan`
韓国語	`ko`	`Kore`
ラトビア語	`lv`	`Latn`
リトアニア語	`lt`	`Latn`
マケドニア語	`mk`	`Cyrl`
マレー語	`ms`	`Latn`
マラーティー語	`mr`	`Deva`
ネパール語	`ne`	`Deva`
ノルウェー語	`no`	`Latn`
ペルシャ語	`fa`	`Arab`
ポーランド語	`pl`	`Latn`
ポルトガル語（ポルトガル、ブラジル）	`pt`	`Latn`
ルーマニア語	`ro`	`Latn`
ロシア語	`ru`	`Cyrl`
セルビア語	`sr`	`Cyrl`
スロバキア語	`sk`	`Latn`
スロベニア語	`sl`	`Latn`
スペイン語	`es`	`Latn`
スウェーデン語	`sv`	`Latn`
タガログ語	`tl`	`Latn`
トルコ語	`tr`	`Latn`
ウクライナ語	`uk`	`Cyrl`
ベトナム語	`vi`	`Latn`
イディッシュ語	`yi`	`Hebr`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-form-parser-v1.0-2020-09-23`	Stable	なし	なし	以前のバージョン。最適な品質と完全な機能セットを実現するには、Form Parser v2.0 を使用してください。
`pretrained-form-parser-v2.0-2022-11-10`	Stable	フィールドを表示する `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	なし	推奨バージョン。汎用エンティティをサポートし、アップグレードされたテーブル、KVP、チェックボックスモデル、200 を超える言語が含まれています。
`pretrained-form-parser-v2.1-2023-06-26`	リリース候補版	なし	なし	公開プレビュー版。デジタル PDF ファイルからのネイティブテキスト抽出が有効になっている v2.0 と同じモデルです。

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	100

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

詳細 Form パーサー

レイアウトパーサー

説明

ドキュメントのコンテンツ要素（テキスト、表、リスト）を抽出し、コンテキストアウェアチャンクを作成します。

レイアウトパーサーは、テキスト、表、リストなどのドキュメントコンテンツ要素を抽出し、生成 AI や検索アプリケーションでの情報検索を容易にするコンテキストアウェアチャンクを作成します。

カテゴリ 抽出

関数レイアウト解析、ドキュメントチャンキング

リリースステージ 一般提供

アクセスステータス 公開

Type in API LAYOUT_PARSER_PROCESSOR

注

このパーサーは、PDF、HTML、DOCX ファイルをサポートしています。

サポートされている言語

言語の完全なリスト

言語名	BCP 47 タグ	スクリプト
アフリカーンス語	`af`	`Latn`
アルバニア語	`sq`	`Latn`
アラビア語	`ar`	`Arab`
アルメニア語	`hy`	`Armn`
ベラルーシ語	`be`	`Cyrl`
ベンガル語	`bn`	`Beng`
ベンガル語	`bn`	`Beng`
ブルガリア語	`bg`	`Cyrl`
カタロニア語	`ca`	`Latn`
中国語	`zh`	`Hani`
クロアチア語	`hr`	`Latn`
チェコ語	`cs`	`Latn`
デンマーク語	`da`	`Latn`
オランダ語	`nl`	`Latn`
英語	`en`	`Latn`
エストニア語	`et`	`Latn`
フィリピン語	`fil`	`Latn`
フィンランド語	`fi`	`Latn`
フランス語	`fr`	`Latn`
ドイツ語	`de`	`Latn`
ギリシャ語	`el`	`Grek`
グジャラート語	`gu`	`Gujr`
ヘブライ語	`iw`	`Hebr`
ヒンディー語	`hi`	`Deva`
ハンガリー語	`hu`	`Latn`
アイスランド語	`is`	`Latn`
インドネシア語	`id`	`Latn`
イタリア語	`it`	`Latn`
日本語	`ja`	`Jpan`
カンナダ語	`kn`	`Knda`
クメール語	`km`	`Khmr`
韓国語	`ko`	`Kore`
ラオ語	`lo`	`Laoo`
ラトビア語	`lv`	`Latn`
リトアニア語	`lt`	`Latn`
マケドニア語	`mk`	`Cyrl`
マレー語	`ms`	`Latn`
マラヤーラム語	`ml`	`Mlym`
マラーティー語	`mr`	`Deva`
ネパール語	`ne`	`Deva`
ノルウェー語	`no`	`Latn`
ペルシャ語	`fa`	`Arab`
ポーランド語	`pl`	`Latn`
ポルトガル語（ポルトガル、ブラジル）	`pt`	`Latn`
パンジャブ語	`pa`	`Guru`
ルーマニア語	`ro`	`Latn`
ロシア語	`ru`	`Cyrl`
セルビア語	`sr`	`Cyrl`
スロバキア語	`sk`	`Latn`
スロベニア語	`sl`	`Latn`
スペイン語	`es`	`Latn`
スウェーデン語	`sv`	`Latn`
タガログ語	`tl`	`Latn`
タミル語	`ta`	`Taml`
テルグ語	`te`	`Telu`
タイ語	`th`	`Thai`
トルコ語	`tr`	`Latn`
ウクライナ語	`uk`	`Cyrl`
ベトナム語	`vi`	`Latn`
イディッシュ語	`yi`	`Hebr`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-layout-parser-v1.0-2024-06-03`	Stable	なし	なし	推奨バージョン。

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	500

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

詳細レイアウトパーサー

事前トレーニング済みプロセッサを確認する

銀行明細書パーサー

説明

名前、口座、取引などの情報を銀行の明細書から抽出します。

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API BANK_STATEMENT_PROCESSOR

注

複数ページの入力ファイルのページが正しいドキュメントタイプで、サポートされているバージョンのいずれかである場合、プロセッサはサポートされている最初のドキュメントに対してエンティティ抽出を行います。入力ファイルに該当するドキュメントが見つからない場合、プロセッサはエラーメッセージを返します。

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-bankstatement-v1.0-2021-08-08`	Stable	なし	なし
`pretrained-bankstatement-v1.1-2021-08-13`	Stable	なし	なし
`pretrained-bankstatement-v2.0-2021-12-10`	Stable	なし	なし
`pretrained-bankstatement-v3.0-2022-05-16`	Stable	なし	なし	このバージョンでは、入力ファイルに単一の銀行明細書が含まれていることを前提としています。デフォルトバージョンとは異なり、このバージョンでは銀行の明細書が入力ファイルにないかチェックされず、銀行の明細書が見つからない場合でもエラーは返されません。
`pretrained-bankstatement-v4.0-2023-07-31`	リリース候補版	なし	なし
`pretrained-bankstatement-v5.0-2023-12-06`	リリース候補版	なし	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	30

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧

bank_address
bank_name

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

アップトレーニング

人間参加型

ラベル付け手順 [新しいウィンドウで開く] を選択します。

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

W2 パーサー

説明

Form W2 から従業員、雇用主、賃金などを抽出

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API FORM_W2_PROCESSOR

注

複数ページの入力ファイルのページが正しいドキュメントタイプで、サポートされているバージョンのいずれかである場合、プロセッサはサポートされている最初のドキュメントに対してエンティティ抽出を行います。入力ファイルに該当するドキュメントが見つからない場合、プロセッサはエラーメッセージを返します。

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

サポートされているフォーム/バージョン

2020（標準版とカスタマイズ版）
2019（標準版とカスタマイズ版）
2018（標準版とカスタマイズ版）

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-w2-v1.0-2020-10-01`	Stable	なし	なし
`pretrained-w2-v1.1-2022-01-27`	Stable	なし	なし
`pretrained-w2-v1.2-2022-01-28`	Stable	フィールドを表示する `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	なし	品質の改善と新しいフィールドのサポート。分割ツールは含まれません。
`pretrained-w2-v2.0-2022-03-30`	リリース候補版	フィールドを表示する `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	なし	品質の改善、ボックス 12 フィールドのサポート、`EmployeeName`、`EmployeeAddress`、`EmployerNameAndAddress` のきめ細かい予測。これらのフィールドはすべて出力の一部ではなくなり、追加のフィールドに置き換えられます。
`pretrained-w2-v2.1-2022-06-08`	Stable	フィールドを表示する `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	なし	バージョン `pretrained-w2-v2.0-2022-03-30` に似ていますが、品質がさらに向上し、エンティティ `EmployeeName_Suffix` が 1 つ追加されています。

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	15

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧

EmployerNameAndAddress
EIN

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

米国パスポートパーサー

説明

名前、ドキュメント ID、生年月日などのフィールドを抽出します。

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API US_PASSPORT_PROCESSOR

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-us-passport-v1.0-2021-06-14`	Stable	なし	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	2
最大ページ数（バッチ/オフライン/非同期リクエスト）:	2

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

Date Of Birth
Expiration Date
Issue Date

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

光熱費パーサー

説明

公共料金の請求書からテキストと値（サプライヤー名や過去の支払額など）を抽出します。

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 制限付き ^[*]

Type in API UTILITY_PROCESSOR

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-utility-v1.1-2021-04-09`	Stable	なし	なし
`pretrained-utility-v1.2-2022-12-15`	リリース候補版	なし	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	10
最大ページ数（バッチ/オフライン/非同期リクエスト）:	200

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

アップトレーニング

人間参加型

ラベル付け手順 [新しいウィンドウで開く] を選択します。

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

身分証明書パーサー

説明

複数のシグナルを使用して身分証明書の有効性を予測します。

身分証明書の証明プロセッサは、次の 4 つのシグナルを使用して身分証明書の有効性を予測できるように設計されています。

現在、プロセッサは次のシグナルから情報を返します。

fraud_signals_is_identity_document 検出: 画像に認識済みの身分証明書が含まれているかどうかを予測します。
fraud_signals_suspicious_words 検出: 身分証明書では一般的に使われない単語が存在するかどうかを予測します。
fraud_signals_image_manipulation 検出: 画像編集ツールで画像が変更または改ざんされたかどうかを予測します。
fraud_signals_online_duplicate 検出: 画像がオンラインで見つかるかどうかを予測します（米国のみ）。

カテゴリ トレーニング済み

関数 OCR、品質分析

リリースステージ 一般提供

アクセスステータス 公開

Type in API ID_PROOFING_PROCESSOR

注

現在、オンライン重複検出機能は米国のデータセンターで処理されています。米国以外では、この機能のリージョンとマルチリージョンのサポートは利用できません。
このプロセッサは、新しいプロセッサバージョンのリリースよりも頻繁に更新されるアルゴリズムによってサポートされています。このため、同じプロセッサバージョンを使用している場合でも、プロセッサから返される出力が時間の経過とともに異なる場合があります。たとえば、オンライン重複検出システムは、ウェブ上の画像をモニタリングします。プロセッサのバージョンで追跡できるよりも速く、システムの動作が変化する可能性があります。
責任ある AI に関する注意事項^[†]と人間による審査^[‡]を参照してください。

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

サポートされているフォーム/バージョン

米国のパスポート、パスカード、運転免許証のサポート。

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-id-proofing-v1.0-2022-10-03`	Stable	なし	なし
`pretrained-id-proofing-v1.1-2023-05-18`	リリース候補版	フィールドを表示する `fraud_signals_photocopy_detection`	なし	追加のコピー検出シグナル
`pretrained-id-proofing-v1.2-2023-10-04`	リリース候補版	フィールドを表示する `fraud_signals_photocopy_detection`	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	2
最大ページ数（バッチ/オフライン/非同期リクエスト）:	2

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

支払い明細パーサー

説明

給与明細から名前、ビジネス、金額などを抽出します

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API PAYSTUB_PROCESSOR

注

複数ページの入力ドキュメントに複数の有効な給与明細書が含まれている場合、最初の有効な給与明細書からのみエンティティが抽出されます。入力ファイルに給与明細が見つからない場合、プロセッサはエラーメッセージを返します。

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-paystub-v1.0-2021-03-19`	Stable	なし	なし
`pretrained-paystub-v1.1-2021-08-13`	Stable	フィールドを表示する `net_pay` `net_pay_ytd` `employee_account_number`	なし	品質の改善と新しいフィールドのサポート。
`pretrained-paystub-v1.2-2021-12-10`	Stable	なし	なし
`pretrained-paystub-v2.0-2022-05-17`	リリース候補版	フィールドを表示する `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	なし	このバージョンでは、入力ファイルに単一の給与明細書が含まれていることを前提としています。デフォルトバージョンとは異なり、このバージョンでは給与明細書が入力ファイルにないかチェックされず、給与明細書が見つからない場合でもエラーは返されません。品質の向上、新しいフィールドのサポート、新しいスキーマ。ボーナス、コミッション、休日、残業、基本給、有給休暇が earning_item/earning_this_period に含まれるようになりました。これらの年初来バージョンは earning_item/earning_ytd にあります。直接入金と従業員の口座番号が direct_deposit_item の下にネストされるようになりました。非同期ページの上限は 10 です。
`pretrained-paystub-v2.0-2022-07-22`	Stable	なし	なし	品質の改善とアップトレーニングの強化。
`pretrained-paystub-v3.0-2023-12-06`	リリース候補版	なし	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	50

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧

employer_address
employer_name

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

アップトレーニング

人間参加型

ラベル付け手順 [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

米国運転免許証パーサー

説明

名前、ドキュメント ID、生年月日などのフィールドを抽出します。

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API US_DRIVER_LICENSE_PROCESSOR

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

サポートされているフォーム/バージョン

50 州すべてとワシントン DC をサポート。

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-us-driver-license-v1.0-2021-06-14`	Stable	なし	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	2
最大ページ数（バッチ/オフライン/非同期リクエスト）:	2

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

Date Of Birth
Expiration Date
Issue Date

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

eu
us

経費パーサー

説明

費用に関するドキュメントから、費用の日付、サプライヤー名、合計金額、通貨などのテキストと値を抽出します。

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API EXPENSE_PROCESSOR

サポートされている言語

言語の完全なリスト

言語名	BCP 47 タグ	スクリプト
ドイツ語	`de`	`Latn`
英語	`en`	`Latn`
スペイン語	`es`	`Latn`
フランス語	`fr`	`Latn`
日本語	`ja`	`Jpan`
オランダ語	`nl`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-expense-v1.1-2021-04-09`	Stable	なし	なし	2021 年 4 月にリリースされました。まもなくサポートが終了する予定です。
`pretrained-expense-v1.2-2022-02-18`	Stable	なし	なし	注: 2025 年 4 月 30 日をもって、米国（US）と欧州連合（EU）でサポートを終了します。
`pretrained-expense-v1.3-2022-07-15`	Stable	フィールドを表示する `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: 日本語	ホテルとレンタカーのフォリオのサポート。注: 2025 年 4 月 30 日をもって、米国（US）と欧州連合（EU）でサポートを終了します。
`pretrained-expense-v1.3.2-2024-09-11`	リリース候補版	フィールドを表示する `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: 日本語	基盤となるビジョンモデルが強化された v1.3 へのアップグレード。
`pretrained-expense-v1.4-2022-11-18`	リリース候補版	フィールドを表示する `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: 日本語 `it`: イタリア語 `pt`: ポルトガル語（ポルトガルとブラジル）	パフォーマンスの改善とアップトレーニングのサポート。最大ページ数（オンライン/同期リクエスト）の上限が 15 に引き上げられました。注: 2025 年 4 月 30 日をもって、米国（US）と欧州連合（EU）でサポートを終了します。
`pretrained-expense-v1.4.2-2024-09-12`	リリース候補版	フィールドを表示する `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: 日本語 `it`: イタリア語 `pt`: ポルトガル語（ポルトガルとブラジル）	基盤となるビジョンモデルが強化された v1.4 へのアップグレード。

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	10
最大ページ数（バッチ/オフライン/非同期リクエスト）:	10

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧

supplier_address
supplier_name
supplier_phone

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

アップトレーニング

人間参加型

ラベル付け手順 [新しいウィンドウで開く] を選択します。

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Invoice パーサー

説明

請求書からテキストと値（請求書番号、サプライヤー名、請求額、税額、請求書の日付、期限など）を抽出します。

請求書 Parser は、請求書番号、サプライヤー名、請求額、税額、請求日、期限、項目の金額など、ヘッダーと項目の両方のフィールドを抽出します。

カテゴリ トレーニング済み

関数 OCR、エンティティ抽出

リリースステージ 一般提供

アクセスステータス 公開

Type in API INVOICE_PROCESSOR

サポートされている言語

言語の完全なリスト

言語名	BCP 47 タグ	スクリプト
ドイツ語	`de`	`Latn`
英語	`en`	`Latn`
スペイン語	`es`	`Latn`
エストニア語	`et`	`Latn`
フランス語	`fr`	`Latn`
イタリア語	`it`	`Latn`
ラトビア語	`lv`	`Latn`
リトアニア語	`lt`	`Latn`
オランダ語	`nl`	`Latn`
ポルトガル語（ポルトガル、ブラジル）	`pt`	`Latn`
ルーマニア語	`ro`	`Latn`
スウェーデン語	`sv`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-invoice-v1.1-2021-04-09`	Stable	なし	なし
`pretrained-invoice-v1.2-2022-02-18`	Stable	なし	なし	まもなくサポートが終了する予定です。
`pretrained-invoice-v1.3-2022-07-15`	Stable	なし	`it`: イタリア語 `pt`: ポルトガル語（ポルトガルとブラジル） `ro`: ルーマニア語 `sv`: スウェーデン語 `et`: エストニア語 `lv`: ラトビア語 `lt`: リトアニア語	アップトレーニング可能なプロセッサバージョン。最大ページ数（オンライン/同期リクエスト）が 15 に増加しました。
`pretrained-invoice-v1.4-2022-10-21`	リリース候補版	なし	なし	アップトレーニング可能なプロセッサバージョン。最大ページ数（オンライン/同期リクエスト）が 15 に増加しました。
`pretrained-invoice-v1.5-2023-09-15`	リリース候補版	なし	なし
`pretrained-invoice-v2.0-2023-12-06`	リリース候補版	なし	なし

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	200

最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの一覧

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

拡充フィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの一覧

supplier_address
supplier_name
supplier_phone

正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

アップトレーニング

人間参加型

ラベル付け手順 [新しいウィンドウで開く] を選択します。

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

ドキュメントを分類する

カスタム分類器

説明

一連のクラスからドキュメントタイプを分類するモデルをトレーニングします。

カテゴリ 分類

関数 OCR、分類

リリースステージ 一般提供

アクセスステータス 公開

Type in API CUSTOM_CLASSIFICATION_PROCESSOR

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	200

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

詳細カスタム分類プロセッサを作成する

カスタムスプリッター

説明

複数のドキュメントを含むファイルを個別の分類されたドキュメントに分割するようにモデルをトレーニングします。

カテゴリ 分類

関数 OCR、分類、分割

リリースステージ 一般提供

アクセスステータス 公開

Type in API CUSTOM_SPLITTING_PROCESSOR

注

i18n は、カスタムトレーニングオプションでのみサポートできます。

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	1000

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

詳細カスタムスプリッタープロセッサを作成する

ドキュメントを要約する

Summarizer

説明

短いドキュメントと長いドキュメントの概要や箇条書きの要約を取得します。

カテゴリ 事前トレーニング済み

関数要約

リリースステージ プレビュー

アクセスステータス 公開

Type in API SUMMARY_PROCESSOR

サポートされている言語

言語名	BCP 47 タグ	スクリプト	手書き入力のサポート
英語	`en`	`Latn`

プロセッサのバージョン

バージョン ID	リリースチャンネル	検出された追加フィールド	サポートされる言語の追加	説明
`pretrained-foundation-model-v1.0-2023-08-22`	Stable	なし	なし	Google の基盤モデル

詳細については、プロセッサバージョンの管理をご覧ください。

割り当てと上限

最大ページ数（オンライン/同期リクエスト）:	15
最大ページ数（バッチ/オフライン/非同期リクエスト）:	250

アップトレーニング

人間参加型

サンプル入力ファイル [新しいウィンドウで開く] を選択します。

出力例: [新しいウィンドウで開く] を選択します。

サポートされているリージョン

us

詳細カスタムサマライザー

脚注

^[*] このプロセッサは、一部のお客様にのみアクセスが制限されています。

API アクセスをリクエストするには、Document AI の制限付きアクセスお客様リクエストフォームに必要事項を記入してお送りください。このフォームには、お客様、お客様が所属している会社、用途に関する情報を入力する必要があります。アクセスには Google Cloud プロジェクト ID が必要です。新しい Google Cloud プロジェクトを作成するか、既存のプロジェクトのプロジェクト ID を確認する場合は、こちらの手順をご覧ください。

フォームを送信すると、Document AI チームがお客様のリクエストを審査し、お客様がアクセス基準を満たしているかどうか確認いたします。アクセスが承認されると、この機能のアクセス方法と使用方法を説明するメールが届きます。

^[†] 身分証明書の検証は、入力画像が本物の身分証明書を表すかどうかを特定するために役立つ身分証明書から情報を抽出して評価します。

Google Cloudでは、お客様が AI ソリューションを安全に開発、実装できるよう支援することを最優先としています。身元確認は、Google の AI 原則に従って開発されています。

Google の AI に関する原則と現在のプロダクト設計に基づき、以下のような場合に身分証明書の確認を使用する場合は、慎重に検討し、潜在的なメリットとリスクを慎重に評価することを強くおすすめします。

人権に影響を与える可能性がある予測について、人間が関与しない意思決定を行う。
雇用、公共サービスへのアクセス、ヘルスケア、安全性上重要なコンテキストなど、機密性の高いドメイン（ただしこれらに限定されません）。

^[‡] 身元確認は、より広範な身元確認プロセスとワークフローの一部として常に使用してください。ワークフローに人間の審査担当者を配置して、予測されたシグナルが正確かどうかを確認することが重要です。本人確認プロセッサは、ワークフローで ID の人間による確認に代わるものではありません。人間の審査担当者が身分証明書を検証する際に役立つものです。身分証明書の有効性を確認する自動判断ツールとして、身分証明書確認プロセッサを使用しないでください。人間による審査により、ドキュメント処理の精度を高めることができます。また、人間による審査用の専用ツールを使用して予測を評価することもできます。

このテクノロジーを導入する地域の規制を必ず確認し、既存の業界ガイダンスを調査して、ポリシーガイドラインと一般的な公平性の問題を把握してください。トレーニング用データセットのバイアス軽減、パフォーマンスの不均衡に関するカスタムモデルの評価、カスタムモデルを利用する際に検討すべき事項など、機械学習における公平性について学びます。

お客様には、本人確認を実装する際に、公平性、解釈可能性、プライバシー、セキュリティのベストプラクティスを念頭に置くことをおすすめします。責任ある AI を実装する方法について詳しくは、Google の責任ある AI への取り組みに関する推奨事項をご覧ください。

ユースケースとサンプルアプリケーションコードリポジトリの詳細については、ブログ投稿の Document AI で身分証明書の処理を自動化をご覧ください。

サポートされているファイル

プロセッサのリスト

テキストをデジタル化する

Enterprise Document OCR（光学式文字認識）

言語の完全なリスト

ドキュメントからエンティティを抽出します

カスタム エクストラクタ

言語の完全なリスト

正規化されたデータ型の完全なリスト

Form パーサー

言語の完全なリスト

フィールドを表示する

レイアウト パーサー

言語の完全なリスト

事前トレーニング済みプロセッサを確認する

銀行明細書パーサー

フィールドの一覧

拡充されたフィールドの一覧

正規化されたフィールドの完全なリスト

W2 パーサー

フィールドを表示する

フィールドを表示する

フィールドを表示する

フィールドの一覧

拡充されたフィールドの一覧

米国パスポート パーサー

フィールドの一覧

正規化されたフィールドの完全なリスト

光熱費パーサー

フィールドの一覧

正規化されたフィールドの完全なリスト

身分証明書パーサー

フィールドを表示する

フィールドを表示する

フィールドの一覧

正規化されたフィールドの完全なリスト

支払い明細パーサー

フィールドを表示する

フィールドを表示する

フィールドの一覧

拡充されたフィールドの一覧

正規化されたフィールドの完全なリスト

米国運転免許証パーサー

フィールドの一覧

正規化されたフィールドの完全なリスト

経費パーサー

言語の完全なリスト

フィールドを表示する

フィールドを表示する

フィールドを表示する

フィールドを表示する

フィールドの一覧

拡充されたフィールドの一覧

正規化されたフィールドの完全なリスト

Invoice パーサー

言語の完全なリスト

フィールドの一覧

拡充されたフィールドの一覧

正規化されたフィールドの完全なリスト

ドキュメントを分類する

カスタム分類器

カスタム スプリッター

ドキュメントを要約する

Summarizer

脚注

カスタムエクストラクタ

レイアウトパーサー

米国パスポートパーサー

カスタムスプリッター