コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
正規化
サポートされている多くの特定のフィールドの場合、Document AI は、各エンティティの textAnchor
から取得した未加工の抽出フィールドに加えて、entity.normalizedValue
も返します。リテラル テキストを正規化します。多くの場合、正規化によりテキスト値がサブフィールドに分割されます。
標準化された形式でデータが含まれるため、後処理を減らし、選択した形式への変換を可能にします。ドキュメントに実際に存在するものを表す mentionText
は、正規化によって変更されることはありません。
正規化されたフィールドは、次のいずれかのカテゴリに属します。
コンソールの正規化された値
Google Cloud コンソールで、正規化されたフィールドには G というアノテーションが付けられます。次に例を示します。
ウェブ アプリケーションに表示される標準化されたフィールドの例。
サポートされるプロセッサ
エンティティの拡充と正規化をサポートするプロセッサとフィールドは次のとおりです。
カスタム エクストラクタは、次の一般的なデータ型( Google ClouddateTime
、currency
、money
、number
)を持つすべてのエンティティの正規化をサポートしています。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-03-04 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-03-04 UTC。"],[],[]]