양식 파서는 키-값 쌍 (KVP), 표, 선택 표시 (체크박스), 일반 필드를 추출하여 추출을 보강하고 자동화합니다. 기본적으로 최대 11개의 일반 항목과 체크박스를 추출할 수 있습니다. 양식 파서로 추출할 필드 (스키마)를 지정하지 않습니다. 모델은 문서의 각 페이지에서 관심 있는 항목을 감지하고 반환합니다.
맞춤 추출기
커스텀 추출기는 스키마에 정의된 항목을 추출하며 기반 모델, 맞춤 모델 기반, 맞춤 템플릿 기반의 세 가지 모델링 옵션을 제공합니다. 학습 데이터가 거의 또는 전혀 없는 기반 모델에서 유망한 결과가 도출되므로 기반 모델을 첫 번째 옵션으로 시작하고 필요에 따라 다른 옵션을 사용해 보는 것이 좋습니다.
파운데이션 모델은 데이터 세트의 최대 5개 라벨이 지정된 문서를 기반으로 제로샷에서 퓨샷 예측을 수행하고, 데이터 세트의 10개 이상의 라벨이 지정된 문서를 사용하여 예측을 미세 조정합니다.
학습 방법
문서 예
문서 레이아웃 변형
자유 형식 텍스트 또는 단락
변동성에 따라 프로덕션 준비 품질을 위한 학습 문서 수
미세 조정 및 기반 모델 (생성형 AI)
계약서, 서비스 약관, 인보이스, 은행 명세서, 선하 증서, 급여 명세서
높은 순서에서 낮은 순서로 (권장)
높음.
중간: 0~50개 이상의 문서
맞춤 모델입니다.
모델
연도 또는 공급업체에 따라 레이아웃이 다른 유사한 양식 (예: W9)
낮음~중간
낮음
높음: 10~100개 이상의 문서
템플릿
고정 레이아웃이 있는 세금 양식 (예: 941 양식 및 709 양식)
없음
낮음
낮음 (문서 3개)
파운데이션 모델은 일반적으로 학습 문서가 적게 필요하므로 모든 가변 레이아웃의 첫 번째 옵션으로 권장됩니다.
레이아웃 파서
레이아웃 파서는 다양한 형식의 문서를 구조화된 표현으로 변환하여 단락, 표, 목록과 같은 콘텐츠와 제목, 페이지 헤더, 바닥글과 같은 구조적 요소에 액세스할 수 있도록 하고, 다양한 생성형 AI 및 탐색 앱에서 정보 검색을 용이하게 하는 컨텍스트 인식 청크를 만듭니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[[["\u003cp\u003eDocument AI offers tools like Form Parser, Custom extractor, and Layout Parser for extracting information from documents based on various use cases.\u003c/p\u003e\n"],["\u003cp\u003eForm Parser automatically extracts key-value pairs, tables, selection marks, and up to 11 generic entities without needing a predefined schema.\u003c/p\u003e\n"],["\u003cp\u003eThe Custom extractor allows users to define their extraction schema and offers three modeling options: foundation model, custom model-based, and custom template-based.\u003c/p\u003e\n"],["\u003cp\u003eFoundation models in Custom extractors are recommended as the first option due to their ability to perform with minimal training data.\u003c/p\u003e\n"],["\u003cp\u003eLayout Parser transforms documents into structured data, identifying elements such as paragraphs, tables, lists, headings, and headers/footers, for use in information retrieval and generative AI applications.\u003c/p\u003e\n"]]],[],null,["# Extraction overview\n===================\n\nDocument AI offers multiple products to extract information from documents\nfor different use cases:\n\n- [Form Parser](#form-parser)\n- Custom extractor, which offers three different modeling types:\n\n - Foundation model\n - Custom model based\n - Custom template based\n- [Layout Parser](#layout-parser)\n\nForm Parser\n-----------\n\nForm Parser extracts key-value pairs (KVP), tables, selection marks (checkboxes),\nand generic fields to augment and automate extraction. It can extract up to 11\ngeneric entities and checkboxes out of the box. You don't specify the fields (schema),\nyou want to extract with the Form Parser. The model detects and returns entities\nof interest from each page of documents.\n\nCustom extractor\n----------------\n\nThe custom extractor extracts entities you define in schema and offers three modeling options:\nfoundation model, custom model based, and custom template based. Given promising\nresults from foundation models with little to no training data, we recommend starting\nwith the foundation model as the first option and try out other options as needed.\nThe foundation models do zero- to few-shot prediction, based on up to 5 labeled\ndocuments in the dataset, and fine-tuned prediction with more than 10 labeled documents in the dataset.\n\nBecause foundation models typically require fewer training documents, they're\nrecommended as the first option for all variable layouts.\n\nLayout Parser\n-------------\n\n| **Note:** Layout Parser is in Public preview\n\nLayout Parser transforms documents in various formats into structured\nrepresentations, making content like paragraphs, tables, lists, and structural\nelements like headings, page headers, and footers accessible, and creating\ncontext-aware chunks that facilitate information retrieval in a range of\ngenerative AI and discovery apps."]]