사전 학습 개요

Document AI는 다양한 사용 사례에 맞게 정보를 위해 문서를 처리하는 여러 제품을 제공합니다.

사전 학습된 파서

자세한 내용은 사전 학습된 프로세서 살펴보기를 참고하세요.

은행 명세서 파서

은행 명세서 파서는 키-값 쌍 (KVP)을 추출합니다. 최대 17개의 일반 항목을 추출할 수 있습니다. 계좌 번호, 고객 이름, 은행 이름, 입금 및 출금과 같은 표 항목 등이 여기에 해당합니다. 추출할 필드(스키마)를 지정하지 않습니다. 은행 명세서 파서는 보강정규화를 지원합니다.

W2 파서

W2 파서는 IRS W2 양식에서 KVP로 추출합니다. 직원 이름, 사회 보장 번호, 고용주, 임금을 비롯한 최대 12개의 일반 항목을 추출할 수 있습니다. 추출할 필드 (스키마)를 지정하지 않습니다. W2 파서는 보강을 지원합니다.

미국 여권 파서

미국 여권 파서는 KVP를 추출합니다. 최대 7개의 일반 항목을 추출할 수 있습니다. 여기에는 이름, 성, 문서 ID, 생년월일이 포함됩니다. 추출할 필드 (스키마)를 지정하지 않습니다. 미국 여권 파서는 정규화를 지원합니다.

유틸리티 파서

유틸리티 파서는 KVP를 추출합니다. 공공요금 청구서에서 최대 75개의 일반 항목을 추출할 수 있습니다. 여기에는 공급업체 이름, 이전 결제 금액, 금액, 설명, 제품 코드, 수량과 같은 항목이 포함됩니다. 유틸리티 파서로 추출할 필드 (스키마)를 지정하지 않습니다.

신분증 증명 파서

신분증 증명 파서는 여러 신호를 사용하여 신분증의 유효성을 예측합니다.

  • fraud_signals_is_identity_document 감지: 이미지에 인식된 신분증이 포함되어 있는지 여부를 예측합니다.
  • fraud_signals_suspicious_words 감지: 신분증에 일반적으로 사용되지 않는 단어가 있는지 여부를 예측합니다.
  • fraud_signals_image_manipulation 감지: 이미지가 이미지 편집 도구를 통해 변경 또는 변조되었는지 여부를 예측합니다.
  • fraud_signals_online_duplicate 감지: 이미지를 온라인에서 찾을 수 있는지 여부를 예측합니다 (미국만 해당).

급여 명세서 파서

급여 명세서 파서가 KVP를 추출합니다. 급여 명세서에서 최대 26개의 일반 항목을 추출할 수 있습니다. 여기에는 직원 이름, 보너스, 수수료, 초과 근무 수당, 지급일 등이 포함됩니다. 추출할 필드 (스키마)를 지정하지 않았습니다. 급여 명세서 파서는 보강정규화를 지원합니다.

미국 운전면허증 파서

미국 운전면허증 파서는 KVP를 추출합니다. 운전면허증에서 최대 8개의 일반 항목을 추출할 수 있습니다. 예: 이름, 성, 문서 ID, 만료일 추출할 필드 (스키마)를 지정하지 않습니다. 미국 운전면허증 파서는 정규화를 지원합니다.

지출 파서

지출 파서는 KVP를 추출합니다. 비용 보고서에서 최대 17개의 일반 항목을 추출할 수 있습니다. 지출 날짜, 공급업체 이름, 총 금액, 통화 등이 여기에 해당합니다. 추출할 필드 (스키마)를 지정하지 않았습니다. 비용 파서는 보강정규화를 지원합니다.

인보이스 파서

인보이스 파서가 KVP를 추출합니다. 인보이스에서 최대 46개의 일반 항목을 추출할 수 있습니다. 인보이스 번호, 공급업체 이름, 인보이스 금액, 세액, 인보이스 날짜, 마감일 등이 여기에 포함됩니다. 추출할 필드 (스키마)를 지정하지 않았습니다. 인보이스 파서는 보강정규화를 지원합니다.

요약 도구

요약 도구는 짧은 문서와 긴 문서의 개요 및 글머리기호 요약을 제공합니다. 요약 도구를 사용하면 요약의 출력 길이를 포괄적, 중간, 간단으로 지정할 수도 있습니다.