Document AI는 Enterprise Knowledge Graph를 사용하여 항목 추출 결과 (지원되는 필드의 경우)를 정규화하고 보강합니다. 예를 들어 123 Main St Apt 1 및 123 Main street # 1 주소는 동일한 표준화된 주소로 정규화될 수 있습니다.
지원되는 각 필드의 경우 Document AI는 원시 추출된 필드 외에도 normalizedValue를 반환하여 리터럴 텍스트를 정규화합니다.
여기에는 후처리를 줄이기 위해 표준화된 형식의 데이터가 포함됩니다.
대부분의 데이터는 다음 카테고리 중 하나에 속합니다.
- 금액
 - 날짜
 - 타임스탬프
 - 주소
 - 불리언
 - 정수
 - 부동 소수점 수
 
샘플 응답
강화된 값은 다음 잘린 샘플에 표시된 대로 entities.normalizedValue 필드에서 확인할 수 있습니다.
{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}
샘플에서 원래 employer_name 'Google Singapore'가 'Google Asia Pacific, Singapore'로 정규화되었습니다.
Google Cloud 콘솔에서 보강되고 정규화된 필드는 G로 주석이 달려 있습니다. 예를 들면 다음과 같습니다.
  지원되는 프로세서
다음은 엔티티 강화를 지원하는 프로세서와 필드입니다.
| 프로세서 | 정보가 추가된 필드 | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
      은행 명세서 파서
  | 
    
      
  | 
  ||||||||||||
      W2 파서
  | 
    
      
  | 
  ||||||||||||
      급여 명세서 파서
  | 
    
      
  | 
  ||||||||||||
      지출 파서
  | 
    
      
  | 
  ||||||||||||
      인보이스 파서
  | 
    
      
  |