프로세서 목록

이 페이지에는 Document AI에서 제공하는 모든 프로세서에 관한 자세한 정보가 포함되어 있습니다. 솔루션 유형별로 모든 프로세서 목록을 볼 수 있습니다.

모든 Document AI 프로세서는 데이터 처리 및 보안 약관을 준수합니다.

자세한 내용은 프로세서 버전 관리 문서를 참고하세요. 또한 전반적인 제품 할당량 및 한도 외에도 특정 프로세서 한도가 적용됩니다.

텍스트 디지털화

Enterprise Document OCR (광학 문자 인식)

설명

다양한 유형의 문서에서 텍스트를 식별하고 추출합니다.

이 프로세서를 사용하면 200개 이상의 언어로 된 문서에서 필기 텍스트를 포함한 텍스트를 식별하고 추출할 수 있습니다. 또한 프로세서는 머신러닝을 사용하여 콘텐츠의 가독성을 기반으로 문서의 품질을 평가합니다.

카테고리 디지털화
함수 OCR, 품질 분석
출시 단계 정식 버전
액세스 상태 공개
API 입력 OCR_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
아프리칸스어 af Latn
알바니아어 sq Latn
아랍어 ar Arab
아르메니아어 hy Armn
벨라루스어 be Cyrl
벵골어 bn Beng
뱅골어 bn Beng
불가리아어 bg Cyrl
카탈로니아어 ca Latn
중국어 zh Hani
크로아티아어 hr Latn
체코 cs Latn
덴마크어 da Latn
네덜란드어 nl Latn
영어 en Latn
에스토니아어 et Latn
필리핀어 fil Latn
핀란드어 fi Latn
프랑스어 fr Latn
독일어 de Latn
그리스어 el Grek
구자라트어 gu Gujr
히브리어 iw Hebr
힌디어 hi Deva
헝가리어 hu Latn
아이슬란드어 is Latn
인도네시아어 id Latn
이탈리아어 it Latn
일본어 ja Jpan
칸나다어 kn Knda
크메르어 km Khmr
한국어 ko Kore
라오어 lo Laoo
라트비아어 lv Latn
리투아니아어 lt Latn
마케도니아어 mk Cyrl
말레이어 ms Latn
말라얄람어 ml Mlym
마라타어 mr Deva
네팔어 ne Deva
노르웨이어 no Latn
페르시아어 fa Arab
폴란드어 pl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
펀자브어 pa Guru
루마니아어 ro Latn
러시아어 ru Cyrl
세르비아어 sr Cyrl
슬로바키아어 sk Latn
슬로베니아어 sl Latn
스페인어 es Latn
스웨덴어 sv Latn
타갈로그어 tl Latn
타밀어 ta Taml
텔루구어 te Telu
태국어 th Thai
터키어 tr Latn
우크라이나어 uk Cyrl
베트남어 vi Latn
이디시어 yi Hebr
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-ocr-v1.0-2020-09-23 정식

없음

없음

사용하지 않는 것이 좋으며 2025년 4월 30일부터 미국 (US) 및 유럽연합 (EU)에서 지원 중단됩니다.
pretrained-ocr-v1.1-2022-09-12 정식

없음

없음

사용하지 않는 것이 좋으며 2025년 4월 30일부터 미국 (US) 및 유럽연합 (EU)에서 지원 중단됩니다.
pretrained-ocr-v1.2-2022-11-10 정식

없음

없음

v1.0의 동결된 모델 버전: 버전 스냅샷의 모델 파일, 구성, 바이너리가 컨테이너 이미지에 최대 18개월 동안 동결됩니다.
pretrained-ocr-v2.0-2023-06-02 정식

없음

없음

문서 사용 사례에 특화된 프로덕션 준비 모델입니다. 모든 OCR 부가기능에 대한 액세스 권한이 포함됩니다.
pretrained-ocr-v2.1-2024-08-07 정식

없음

없음

v2.1의 주요 개선사항은 인쇄된 텍스트 인식 개선, 체크박스 감지 정확성 개선, 읽기 순서 정확성 개선입니다.
pretrained-ocr-v2.1.1-2025-01-31 출시 후보

없음

없음

v2.1.1은 V2.1과 유사하며 US, EU, asia-southeast1를 제외한 모든 리전에서 사용할 수 있습니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 500
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 Enterprise Document OCR

문서에서 항목을 추출합니다.

학습에 사용할 샘플 라벨이 지정된 데이터 세트와 라벨이 지정되지 않은 데이터 세트는 샘플 데이터 세트를 참고하세요.

맞춤 추출기

설명

생성형 AI 또는 맞춤 모델을 사용하여 문서에서 필드를 추출합니다. 모델을 미세 조정하여 문서에서 데이터를 정확하게 추출합니다.

카테고리 추출
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력하기 CUSTOM_EXTRACTION_PROCESSOR
참고
  • 추출에 생성형 AI를 사용하는 경우 다음 사항에 유의하세요.

    • 영어만 공식적으로 지원됩니다.
    • 제공 지역은 US, EU, northamerica-northeast1, asia-southeast1에 있습니다.

지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
아프리칸스어 af Latn
아랍어 ar Arab
아제르바이잔어 az Latn
아제르바이잔어 (키릴 문자) az-Cyrl Cyrl
벨라루스어 be Cyrl
불가리아어 bg Cyrl
보스니아어 bs Latn
카탈로니아어 ca Latn
세부아노어 ceb Latn
체코 cs Latn
웨일즈어 cy Latn
덴마크어 da Latn
독일어 de Latn
그리스어 el Grek
영어 en Latn
에스페란토어 eo Latn
스페인어 es Latn
에스토니아어 et Latn
바스크어 eu Latn
페르시아어 fa Arab
핀란드어 fi Latn
필리핀어 fil Latn
프랑스어 fr Latn
아일랜드어 ga Latn
갈리시아어 gl Latn
힌디어 hi Deva
크로아티아어 hr Latn
아이티 크리올어 ht Latn
헝가리어 hu Latn
인도네시아어 id Latn
아이슬란드어 is Latn
이탈리아어 it Latn
히브리어 iw Hebr
일본어 ja Jpan
자바어 jv Latn
카자흐어 kk Cyrl
한국어 ko Kore
키르기스어 ky Cyrl
라틴어 la Latn
리투아니아어 lt Latn
라트비아어 lv Latn
마케도니아어 mk Cyrl
몽골어 mn Cyrl
마라타어 mr Deva
말레이어 ms Latn
몰타어 mt Latn
네팔어 ne Deva
네덜란드어 nl Latn
노르웨이어 no Latn
폴란드어 pl Latn
파슈토어 ps Arab
포르투갈어 (포르투갈 및 브라질) pt Latn
루마니아어 ro Latn
러시아어 ru Cyrl
러시아어 (페트린 철자법) ru-PETR1708 Cyrl
산스크리트 sa Deva
슬로바키아어 sk Latn
슬로베니아어 sl Latn
알바니아어 sq Latn
세르비아어 sr Cyrl
스웨덴어 sv Latn
스와힐리어 sw Latn
타갈로그어 tl Latn
터키어 tr Latn
우크라이나어 uk Cyrl
우르두어 ur Arab
우즈베크어 uz Latn
우즈베크어(키릴 문자) uz-Cyrl Cyrl
베트남어 vi Latn
이디시어 yi Hebr
중국어(간체) zh-Hans Hani
중국어(번체) zh-Hant Hani
줄루어 zu Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-foundation-model-v1.0-2023-08-22 정식

없음

없음

특수한 비전 모델과 기반 모델을 기반으로 문서 사용 사례에 특화된 프로덕션 준비 후보입니다.
pretrained-foundation-model-v1.1-2024-03-12 출시 후보

없음

없음

Gemini 1.0 Pro LLM 및 전문 언어 및 비전 모델을 비롯한 새로 개발된 기술을 기반으로 하는 출시 후보입니다. 체크박스 감지와 같은 고급 OCR 기능도 포함되어 있습니다.
pretrained-foundation-model-v1.2-2024-05-10 정식

없음

없음

Gemini 1.5 Pro LLM 및 특수 언어 및 비전 모델을 비롯한 새로 개발된 기술을 기반으로 하는 프로덕션 준비 후보입니다. 체크박스 감지와 같은 고급 OCR 기능도 포함되어 있습니다. 지원되는 최대 토큰 한도를 사용하거나 최신 모델을 실험하려는 사용자에게 권장됩니다.
pretrained-foundation-model-v1.3-2024-08-31 정식

없음

없음

Gemini 1.5 Flash LLM을 기반으로 하는 프로덕션 준비 후보입니다. 체크박스 감지와 같은 고급 OCR 기능도 포함되어 있습니다. 지연 시간을 최소화하려는 사용자에게 권장됩니다.
pretrained-foundation-model-v1.4-2025-02-05 출시 후보

없음

없음

Gemini 2.0 Flash LLM을 기반으로 하는 프로덕션 준비 후보입니다. Gemini 2.0 Flash LLM을 기반으로 하는 프로덕션 준비 후보입니다. 체크박스 감지와 같은 고급 OCR 기능도 포함되어 있습니다. 최신 모델을 실험하려는 사용자에게 권장됩니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
정규화된 데이터 유형

자세한 내용은 보강 및 정규화데이터 세트 만들기 페이지를 참고하세요.

정규화된 데이터 유형의 전체 목록
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 커스텀 추출기

양식 파서

설명

OCR 텍스트 외에도 문서에서 일반적인 키-값 쌍 (항목 및 체크박스), 표, 일반 항목을 추출합니다.

이 프로세서는 고급 머신러닝 기술을 적용하여 200개 이상의 언어로 된 문서에서 키-값 쌍, 체크박스, 표를 추출합니다. 또한 이 프로세서는 딥 러닝 모델을 활용하여 다양한 문서 유형에 일반적으로 포함되는 11개의 일반 항목을 추출합니다.

카테고리 추출
함수 OCR, 양식 파싱, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 FORM_PARSER_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
아프리칸스어 af Latn
알바니아어 sq Latn
아랍어 ar Arab
벨라루스어 be Cyrl
카탈로니아어 ca Latn
중국어 zh Hani
크로아티아어 hr Latn
체코 cs Latn
덴마크어 da Latn
네덜란드어 nl Latn
영어 en Latn
에스토니아어 et Latn
필리핀어 fil Latn
핀란드어 fi Latn
프랑스어 fr Latn
독일어 de Latn
히브리어 iw Hebr
힌디어 hi Deva
헝가리어 hu Latn
아이슬란드어 is Latn
인도네시아어 id Latn
이탈리아어 it Latn
일본어 ja Jpan
한국어 ko Kore
라트비아어 lv Latn
리투아니아어 lt Latn
마케도니아어 mk Cyrl
말레이어 ms Latn
마라타어 mr Deva
네팔어 ne Deva
노르웨이어 no Latn
페르시아어 fa Arab
폴란드어 pl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
루마니아어 ro Latn
러시아어 ru Cyrl
세르비아어 sr Cyrl
슬로바키아어 sk Latn
슬로베니아어 sl Latn
스페인어 es Latn
스웨덴어 sv Latn
타갈로그어 tl Latn
터키어 tr Latn
우크라이나어 uk Cyrl
베트남어 vi Latn
이디시어 yi Hebr
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-form-parser-v1.0-2020-09-23 정식

없음

없음

기존 버전 최상의 품질과 전체 기능 세트를 사용하려면 양식 파서 v2.0을 사용하세요.
pretrained-form-parser-v2.0-2022-11-10 정식
필드 표시
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number

없음

권장 버전입니다. 일반 항목을 지원하며 업그레이드된 표, KVP, 체크박스 모델, 200개가 넘는 언어를 포함합니다.
pretrained-form-parser-v2.1-2023-06-26 출시 후보

없음

없음

공개 미리보기 버전 디지털 PDF 파일에서 기본 텍스트 추출이 사용 설정된 v2.0과 동일한 모델입니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 100
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 양식 파서

레이아웃 파서

설명

문서 콘텐츠 요소 (텍스트, 표, 목록)를 추출하고 컨텍스트 인식 청크를 만듭니다.

레이아웃 파서는 텍스트, 표, 목록과 같은 문서 콘텐츠 요소를 추출하고 생성형 AI 및 탐색 애플리케이션에서 정보 검색을 용이하게 하는 컨텍스트 인식 청크를 만듭니다.

카테고리 추출
함수 레이아웃 파싱, 문서 청크 처리
출시 단계 정식 버전
액세스 상태 공개
API 입력하기 LAYOUT_PARSER_PROCESSOR
참고
  • 이 파서는 PDF, HTML, DOCX 파일을 지원합니다.
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
아프리칸스어 af Latn
알바니아어 sq Latn
아랍어 ar Arab
아르메니아어 hy Armn
벨라루스어 be Cyrl
벵골어 bn Beng
뱅골어 bn Beng
불가리아어 bg Cyrl
카탈로니아어 ca Latn
중국어 zh Hani
크로아티아어 hr Latn
체코 cs Latn
덴마크어 da Latn
네덜란드어 nl Latn
영어 en Latn
에스토니아어 et Latn
필리핀어 fil Latn
핀란드어 fi Latn
프랑스어 fr Latn
독일어 de Latn
그리스어 el Grek
구자라트어 gu Gujr
히브리어 iw Hebr
힌디어 hi Deva
헝가리어 hu Latn
아이슬란드어 is Latn
인도네시아어 id Latn
이탈리아어 it Latn
일본어 ja Jpan
칸나다어 kn Knda
크메르어 km Khmr
한국어 ko Kore
라오어 lo Laoo
라트비아어 lv Latn
리투아니아어 lt Latn
마케도니아어 mk Cyrl
말레이어 ms Latn
말라얄람어 ml Mlym
마라타어 mr Deva
네팔어 ne Deva
노르웨이어 no Latn
페르시아어 fa Arab
폴란드어 pl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
펀자브어 pa Guru
루마니아어 ro Latn
러시아어 ru Cyrl
세르비아어 sr Cyrl
슬로바키아어 sk Latn
슬로베니아어 sl Latn
스페인어 es Latn
스웨덴어 sv Latn
타갈로그어 tl Latn
타밀어 ta Taml
텔루구어 te Telu
태국어 th Thai
터키어 tr Latn
우크라이나어 uk Cyrl
베트남어 vi Latn
이디시어 yi Hebr
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-layout-parser-v1.0-2024-06-03 정식

없음

없음

권장 버전입니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 500
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us
추가 정보 레이아웃 파서

사전 학습된 프로세서 살펴보기

은행 명세서 파서

설명

은행 명세서에서 이름, 계좌, 거래 내역 등 추출

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력하기 BANK_STATEMENT_PROCESSOR
참고
  • 여러 페이지 입력 파일의 페이지가 올바른 문서 유형이고 지원되는 버전 중 하나인 경우 프로세서는 지원되는 첫 번째 문서에서 항목 추출을 실행합니다. 프로세서가 입력 파일에서 관련 문서를 찾지 못하면 프로세서가 오류 메시지를 반환합니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-bankstatement-v1.0-2021-08-08 정식

없음

없음

pretrained-bankstatement-v1.1-2021-08-13 정식

없음

없음

pretrained-bankstatement-v2.0-2021-12-10 정식

없음

없음

pretrained-bankstatement-v3.0-2022-05-16 정식

없음

없음

이 버전에서는 입력 파일에 단일 은행 명세서가 포함되어 있다고 가정합니다. 기본 버전과 달리 이 버전은 입력 파일의 은행 명세서를 확인하지 않으며 은행 명세서가 없더라도 오류를 반환하지 않습니다.
pretrained-bankstatement-v4.0-2023-07-31 출시 후보

없음

없음

pretrained-bankstatement-v5.0-2023-12-06 출시 후보

없음

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 30
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
보강된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • bank_address
  • bank_name
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
업트레이닝
인간 참여형(Human-In-The-Loop)
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

W2 파서

설명

W2 양식에서 직원, 고용주, 임금 등 추출

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력하기 FORM_W2_PROCESSOR
참고
  • 여러 페이지 입력 파일의 페이지가 올바른 문서 유형이고 지원되는 버전 중 하나인 경우 프로세서는 지원되는 첫 번째 문서에서 항목 추출을 실행합니다. 프로세서가 입력 파일에서 관련 문서를 찾지 못하면 프로세서가 오류 메시지를 반환합니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
지원되는 양식/버전
  • 2020 (표준 및 맞춤 버전)
  • 2019 (표준 및 맞춤설정 버전)
  • 2018 (표준 및 맞춤 버전)
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-w2-v1.0-2020-10-01 정식

없음

없음

pretrained-w2-v1.1-2022-01-27 정식

없음

없음

pretrained-w2-v1.2-2022-01-28 정식
필드 표시
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

없음

품질 개선 및 새 필드 지원. 스플리터는 포함되지 않습니다.

pretrained-w2-v2.0-2022-03-30 출시 후보
필드 표시
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

없음

품질 개선 및 박스 12 필드 지원, EmployeeName, EmployeeAddress, EmployerNameAndAddress의 세분화된 예측. 이 모든 항목은 더 이상 출력에 포함되지 않으며 추가 필드로 대체됩니다.

pretrained-w2-v2.1-2022-06-08 정식
필드 표시
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

없음

품질이 추가로 개선되고 항목 EmployeeName_Suffix이 하나 더 도입된 pretrained-w2-v2.0-2022-03-30 버전과 유사합니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 15
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
보강된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • EmployerNameAndAddress
  • EIN
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

미국 여권 파서

설명

이름, 문서 ID, 생년월일 등의 필드를 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 US_PASSPORT_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-us-passport-v1.0-2021-06-14 정식

없음

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • Date Of Birth
  • Expiration Date
  • Issue Date
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

공과금 파서

설명

공과금 청구서에서 공급업체 이름, 이전 결제 금액 등의 텍스트 및 값을 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 제한적 [*]
API 입력 UTILITY_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-utility-v1.1-2021-04-09 정식

없음

없음

pretrained-utility-v1.2-2022-12-15 출시 후보

없음

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 10
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
업트레이닝
인간 참여형(Human-In-The-Loop)
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

신분증 증명 파서

설명

여러 신호를 사용하여 신분증의 유효성을 예측합니다.

신분증 증빙 서류 프로세서는 다음과 같은 4개의 신호를 토대로 신분증의 유효성을 예측하도록 설계되었습니다.

프로세서는 현재 다음 신호의 정보를 반환합니다.

  • fraud_signals_is_identity_document 감지: 이미지에 인식된 신분증이 포함되어 있는지 여부를 예측합니다.
  • fraud_signals_suspicious_words 감지: 신분증에 일반적으로 사용되지 않는 단어가 있는지 여부를 예측합니다.
  • fraud_signals_image_manipulation 감지: 이미지가 이미지 편집 도구를 통해 변경 또는 변조되었는지 여부를 예측합니다.
  • fraud_signals_online_duplicate 감지: 이미지를 온라인에서 찾을 수 있는지 여부를 예측합니다 (미국만 해당).

카테고리 선행 학습됨
함수 OCR, 품질 분석
출시 단계 미리보기
액세스 상태 공개
API 입력하기 ID_PROOFING_PROCESSOR
참고
  • 온라인 중복 감지 기능은 현재 미국 데이터 센터에서 처리됩니다. 미국 이외의 지역에서는 이 기능에 리전 및 멀티 리전 지원을 사용할 수 없습니다.
  • 이 프로세서는 새 프로세서 버전이 출시되는 것보다 더 자주 업데이트되는 알고리즘으로 지원됩니다. 따라서 동일한 프로세서 버전을 사용하더라도 프로세서가 시간이 지남에 따라 다른 출력을 반환할 수 있습니다. 예를 들어 온라인 중복 감지 시스템은 웹에 있는 이미지를 모니터링합니다. 그러면 시스템 동작이 프로세서 버전에서 추적할 수 있는 것보다 더 빠르게 변경될 수 있습니다.
  • 책임감 있는 AI에 관한 참고사항[†] 및 사람 검토를 참고하세요.[‡]
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
지원되는 양식/버전
  • 미국 여권, 패스카드, 운전면허증을 지원합니다.
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-id-proofing-v1.0-2022-10-03 정식

없음

없음

pretrained-id-proofing-v1.1-2023-05-18 출시 후보
필드 표시
  • fraud_signals_photocopy_detection

없음

추가로 복사 감지 신호

pretrained-id-proofing-v1.2-2023-10-04 출시 후보
필드 표시
  • fraud_signals_photocopy_detection

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

급여 명세서 파서

설명

급여 명세서에서 이름, 업체명, 금액 등 추출

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력하기 PAYSTUB_PROCESSOR
참고
  • 여러 페이지의 입력 문서에 유효한 급여 명세서가 두 개 이상 포함된 경우 처리기는 유효한 첫 번째 급여 명세서에서만 항목을 추출합니다. 입력 파일에 급여 명세서가 없으면 프로세서가 오류 메시지를 반환합니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-paystub-v1.0-2021-03-19 정식

없음

없음

pretrained-paystub-v1.1-2021-08-13 정식
필드 표시
  • net_pay
  • net_pay_ytd
  • employee_account_number

없음

품질 개선 및 새로운 필드 지원
pretrained-paystub-v1.2-2021-12-10 정식

없음

없음

pretrained-paystub-v2.0-2022-05-17 출시 후보
필드 표시
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

없음

이 버전은 입력 파일에 단일 급여 명세서가 포함되어 있다고 가정합니다. 기본 버전과 달리 이 버전은 입력 파일에서 급여 명세서를 확인하지 않으며 급여 명세서가 없더라도 오류를 반환하지 않습니다.

품질 개선, 새 필드 지원, 새 스키마 이제 보너스, 수수료, 휴일, 초과 근무, 정규 급여, 연차 휴가가 earning_item/earning_this_period에 포함되며, 올해 시작부터 오늘까지 버전은 earning_item/earning_ytd에 포함됩니다. 이제 직불 및 직원 계정 번호가 direct_deposit_item 아래에 중첩됩니다.

비동기 페이지 제한은 10개입니다.

pretrained-paystub-v2.0-2022-07-22 정식

없음

없음

품질 개선 및 업트레이닝 개선사항

pretrained-paystub-v3.0-2023-12-06 출시 후보

없음

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 50
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
보강된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • employer_address
  • employer_name
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
업트레이닝
인간 참여형(Human-In-The-Loop)
라벨 지정 안내 새 창에서 열기
지원되는 지역
  • eu
  • us

미국 운전면허증 파서

설명

이름, 문서 ID, 생년월일 등의 필드를 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 US_DRIVER_LICENSE_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
지원되는 양식/버전
  • 50개 주 및 D.C.를 모두 지원합니다.
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-us-driver-license-v1.0-2021-06-14 정식

없음

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • Date Of Birth
  • Expiration Date
  • Issue Date
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

지출 파서

설명

지출 문서에서 지출 날짜, 공급업체 이름, 총 금액, 통화 등의 텍스트 및 값을 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 EXPENSE_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
독일어 de Latn
영어 en Latn
스페인어 es Latn
프랑스어 fr Latn
일본어 ja Jpan
네덜란드어 nl Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-expense-v1.1-2021-04-09 정식

없음

없음

2021년 4월에 출시되었습니다. 곧 지원 중단될 예정입니다.
pretrained-expense-v1.2-2022-02-18 정식

없음

없음

pretrained-expense-v1.3-2022-07-15 정식
필드 표시
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: 일본어
호텔 및 렌터카 폴리오 지원
pretrained-expense-v1.3.2-2024-09-11 출시 후보
필드 표시
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: 일본어
향상된 기본 비전 모델을 포함하는 v1.3으로 업그레이드되었습니다.
pretrained-expense-v1.4-2022-11-18 출시 후보
필드 표시
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 일본어
  • it: 이탈리아어
  • pt: 포르투갈어 (포르투갈 및 브라질)
성능 개선 및 업트레이닝 지원 최대 페이지 (온라인/동기식 요청) 한도가 15개로 늘어났습니다.
pretrained-expense-v1.4.2-2024-09-12 출시 후보
필드 표시
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 일본어
  • it: 이탈리아어
  • pt: 포르투갈어 (포르투갈 및 브라질)
향상된 기본 비전 모델을 포함하는 v1.4로 업그레이드되었습니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 10
최대 페이지 수 (일괄/오프라인/비동기 요청): 10
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
보강된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • supplier_address
  • supplier_name
  • supplier_phone
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
업트레이닝
인간 참여형(Human-In-The-Loop)
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

인보이스 파서

설명

인보이스에서 인보이스 번호, 공급업체 이름, 인보이스 금액, 세액, 인보이스 날짜, 마감일 등의 텍스트 및 값을 추출합니다.

인보이스 파서는 인보이스 번호, 공급업체 이름, 인보이스 금액, 세액, 인보이스 날짜, 마감일, 항목 금액과 같은 헤더 및 항목 필드를 모두 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 INVOICE_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
독일어 de Latn
영어 en Latn
스페인어 es Latn
에스토니아어 et Latn
프랑스어 fr Latn
이탈리아어 it Latn
라트비아어 lv Latn
리투아니아어 lt Latn
네덜란드어 nl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
루마니아어 ro Latn
스웨덴어 sv Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-invoice-v1.1-2021-04-09 정식

없음

없음

pretrained-invoice-v1.2-2022-02-18 정식

없음

없음

곧 지원 중단될 예정입니다.
pretrained-invoice-v1.3-2022-07-15 정식

없음

  • it: 이탈리아어
  • pt: 포르투갈어 (포르투갈 및 브라질)
  • ro: 루마니아어
  • sv: 스웨덴어
  • et: 에스토니아어
  • lv: 라트비아어
  • lt: 리투아니아어
업트레인 가능한 프로세서 버전입니다. 최대 페이지 (온라인/동기식 요청)가 15개로 늘어났습니다.
pretrained-invoice-v1.4-2022-10-21 출시 후보

없음

없음

업트레인 가능한 프로세서 버전입니다. 최대 페이지 (온라인/동기식 요청)가 15개로 늘어났습니다.
pretrained-invoice-v1.5-2023-09-15 출시 후보

없음

없음

pretrained-invoice-v2.0-2023-12-06 출시 후보

없음

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
최초 버전에서 감지된 필드

필드 감지됨 페이지에서도 이 정보를 확인할 수 있습니다.

필드의 전체 목록
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
보강된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • supplier_address
  • supplier_name
  • supplier_phone
정규화된 필드

자세한 내용은 보강 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
업트레이닝
인간 참여형(Human-In-The-Loop)
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

문서 분류

커스텀 분류 기준

설명

클래스 집합에서 문서 유형을 분류하도록 모델을 학습시킵니다.

카테고리 분류
함수 OCR, 분류
출시 단계 정식 버전
액세스 상태 공개
API 입력 CUSTOM_CLASSIFICATION_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 맞춤 분류 프로세서 만들기

커스텀 분할기

설명

여러 문서가 포함된 파일을 분류된 개별 문서로 분할하도록 모델을 학습합니다.

카테고리 분류
함수 OCR, 분류, 분할
출시 단계 정식 버전
액세스 상태 공개
API 입력하기 CUSTOM_SPLITTING_PROCESSOR
참고
  • i18n은 맞춤 학습 옵션을 통해서만 지원할 수 있습니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 1000
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 맞춤 분할기 프로세서 만들기

문서 요약

요약 도구

설명

짧은 문서와 긴 문서의 개요 및 글머리기호 요약을 확인합니다.

카테고리 사전 학습
함수 요약
출시 단계 미리보기
액세스 상태 공개
API 입력 SUMMARY_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원 여부
영어 en Latn
프로세서 버전
버전 ID 배포 채널 추가 필드 감지됨 지원되는 추가 언어 설명
pretrained-foundation-model-v1.0-2023-08-22 정식

없음

없음

Google 기반 모델

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 250
업트레이닝
인간 참여형(Human-In-The-Loop)
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • us
추가 정보 맞춤 요약 도구

각주

[*] 이 프로세서는 제한된 액세스 권한이 있는 고객만 사용할 수 있습니다.

API 액세스를 요청하려면 Document AI 제한적 액세스 고객 요청 양식을 작성하여 제출하세요. 이 양식에는 귀하, 귀하의 회사, 사용 사례에 대한 정보를 입력해야 합니다. 액세스하려면 Google Cloud 프로젝트 ID가 필요합니다. 새 Google Cloud 프로젝트를 만들거나 기존 프로젝트의 프로젝트 ID를 확인하려면 다음 안내를 참조하세요.

양식을 제출하면 Document AI팀에서 요청을 검토하여 액세스 기준을 충족하는지 확인합니다. 승인되면 이 기능에 액세스하고 사용하는 방법에 대한 안내 이메일이 전송됩니다.

[†] 신분증 증빙은 입력 이미지가 실제 신분증을 나타내는지 식별하는 데 도움이 되는 신분증 문서에서 정보를 추출하고 평가합니다.

Google Cloud는 고객이 AI 솔루션을 안전하게 개발하고 구현할 수 있도록 지원하는 데 우선순위를 두고 있으며, ID 인증은 Google의 AI 원칙에 따라 개발되었습니다.

Google의 AI 원칙 및 현재 제품 설계를 바탕으로 다음과 같은 용도로 본인 인증 서류 확인을 사용할 때는 주의를 기울이고 잠재적인 이점과 위험을 신중하게 평가하는 것이 좋습니다.

  • 인권에 영향을 미칠 수 있는 예측에 대해 사람이 개입하지 않고 의사결정을 내리는 경우
  • 민감한 도메인(예: 고용, 공공 서비스 액세스, 의료, 안전이 중요한 상황)

[‡] 항상 광범위한 ID 감지 절차 및 워크플로의 일부로 ID 증명을 사용하세요. 예측된 신호가 정확한지 확인할 수 있도록 워크플로에 사람 검토자가 있어야 합니다. 본인 인증 프로세서는 워크플로에서 ID의 사람 검토를 대체하기 위한 것이 아니라 사람 검토자가 ID 문서를 확인하는 것을 지원하기 위한 것입니다. 본인 인증 프로세서는 신분증의 유효성을 확인하는 자동화된 결정 도구로 사용해서는 안 됩니다. 사람의 검토를 통해 고객은 문서 처리 정확성을 높이고 기업이 이러한 검토를 사용 설정하기 위해 특화된 도구를 사용하여 예측을 평가할 수 있습니다.

이 기술을 구현하는 지역의 규정을 검토하고 기존 업계 가이드를 조사하여 정책 가이드라인과 일반적인 공정성 문제에 대해 알아보세요. 학습 데이터 세트의 편향을 줄이는 방법, 커스텀 모델의 성능 차이를 평가하는 방법, 커스텀 모델을 사용할 때 고려해야 할 기타 사항을 비롯하여 머신러닝의 공정성에 대해 알아보세요.

Google은 고객이 본인 인증을 구현할 때 공정성, 해석 가능성, 개인 정보 보호 및 보안 권장사항을 염두에 두는 것이 좋습니다. 책임감 있는 AI를 구현하는 방법을 자세히 알아보려면 Google의 책임감 있는 AI 관행 권장사항을 참고하세요.

사용 사례 및 샘플 애플리케이션 코드 저장소에 관한 자세한 내용은 블로그 게시물 Document AI로 신분증 처리 자동화]를 참고하세요.