생성형 AI를 사용한 맞춤 추출기

파생 필드 및 서명 감지

공개 미리보기 파생 필드 기능을 사용하면 Document AI 고객이 직접 텍스트를 추출하는 대신 문서 컨텍스트를 기반으로 지능형 추론 또는 생성을 통해 채워지도록 필드를 구성할 수 있습니다.

이번 출시에서는 문서에 서명이 있는지 감지하는 또 다른 기능도 추가되었습니다. 새로운 signature 항목 유형을 사용하여 이러한 항목의 스키마를 지정할 수 있습니다. 서명 항목은 문서의 시각적 신호를 사용하여 파생됩니다.

맞춤 추출기의 파생 필드

커스텀 추출기는 다음 모델에서 파생 필드를 지원합니다.

문서 스키마에서 라벨을 만들거나 수정할 때 콘솔 UI에서 이러한 기능을 사용 설정할 수 있습니다.

파생 필드는 문서에 명시적으로 작성되지 않은 정보를 추출할 수 있는 강력한 기능입니다. 이렇게 하면 문서의 전체 컨텍스트를 기반으로 지능형 추론 또는 생성을 통해 필드가 채워지도록 구성할 수 있습니다. 이는 기본적인 텍스트 추출을 넘어 다음과 같은 고급 사용 사례를 지원합니다.

  • 주소에서 국가를 추론합니다.
  • 표의 총 항목 수를 계산합니다.
  • 신분증이 '리얼 ID'인지 감지

스키마 생성 예시

다음은 미국 운전면허증을 사용하여 이러한 사용 사례의 파생 필드에 대한 스키마를 만드는 예시와 예상 출력입니다.

  1. 스키마 요소를 만들 때 Derived 메서드를 선택합니다.

    cde-signature-detection-derived-field-1

  2. 설명 라벨을 추가하여 실적을 개선하세요.

    cde-signature-detection-derived-field-2

  3. 서명과 같은 파생 필드는 문서에 라벨을 지정할 때 경계 상자를 설정할 필요가 없습니다. 에서 감지됨을 선택합니다.

    cde-signature-detection-derived-field-3

  4. 서명을 제외한 파생 필드의 경우 라벨링의 일부로 을 입력하여 가능한 출력을 정의할 수 있습니다.

    cde-signature-detection-derived-field-4

예상 출력은 다음과 비슷하며, 서명이 '감지됨' 또는 ''으로 반환되고 파생 필드가 라벨의 설명 프롬프트 요청으로 텍스트로 반환됩니다.

cde-signature-detection-derived-field-5

추출된 개요와 파생된 개요 비교

프로세서 스키마에서 항목을 정의할 때 값이 채워지는 방법을 선택할 수 있습니다.

  • 추출: 기본 방법입니다. 엔티티의 값을 문서 텍스트에서 직접 추출해야 하는 경우에 작동합니다. 시스템에서 텍스트를 식별하고 textAnchor, pageAnchor과 같은 필드를 채워 위치를 표시합니다.

  • Derived: 이 메서드는 문서의 콘텐츠에서 항목의 값을 추론해야 하는 경우에 사용됩니다. 값이 텍스트에 직접 표시되지 않으므로 textAnchorpageAnchor 필드가 채워지지 않습니다.

사용 사례 예: 통화 코드 찾기

문서의 거래에 대한 통화 코드 (예: USD, CAD, EUR)를 식별해야 한다고 가정해 보겠습니다.

  • Extract 사용 시기: 문서에 명확한 통화 기호나 'USD', '€'와 같은 코드가 일관되게 포함되어 있는 경우 Extract 메서드를 사용하여 해당 텍스트를 정확하게 찾아 추출합니다.

  • Derived 사용 시기: 문서에 모호한 기호('$' 등)가 사용되거나(USD, CAD, AUD 등을 나타낼 수 있음) 기호가 전혀 없는 경우 Derived 메서드를 사용합니다. 모델은 청구서 수신 주소나 회사 위치와 같은 문서의 컨텍스트를 분석하여 올바른 ISO 4217 통화 코드를 추론합니다.

구성 권장사항

파생 필드를 최대한 활용하려면 라벨링 중에 스키마의 속성에 대해 명확하고 교육적인 description을 작성하는 것이 좋습니다. 이는 모델이 파생 작업을 수행하도록 안내하는 데 도움이 됩니다.

통화 코드 예시에서는 currency_code라는 이름으로 필드를 만들고 '통화 기호 및 주소와 같은 문서에 있는 컨텍스트 신호를 사용하여 문서에 있는 금액 값의 ISO 4217 통화 코드를 찾습니다.'라는 설명을 제공할 수 있습니다.

제한사항

파생 필드는 페이지별로 생성됩니다. 즉, 여러 페이지의 정보가 필요한 사용 사례는 완전히 지원되지 않습니다. 예를 들어 파생 필드를 구성하여 문서를 요약하면 전체 문서에 대한 하나의 일관된 요약이 아닌 개별 페이지별로 별도의 요약이 생성됩니다. 이 제한사항은 교차 페이지 정보를 사용하여 값을 파생해야 하는 모든 필드에 적용됩니다.

맞춤 추출기의 서명 감지

Document AI의 맞춤 추출기는 맞춤 추출기 모델 pretrained-foundation-model-v1.4-2025-02-05pretrained-foundation-model-v1.5-2025-05-05에서 서명 감지를 지원합니다. 문서 스키마에서 라벨을 만들거나 수정할 때 콘솔 UI에서 이 기능을 사용 설정할 수 있습니다.

서명 감지는 문서에 서명이 있는지 확인할 수 있는 기능입니다. 이 기능은 텍스트를 추출하는 대신 시각적 단서를 분석하여 서명이 있는지 확인합니다.

서명 감지 작동 방식

이 기능을 사용 설정하려면 프로세서 스키마를 정의할 때 signature 데이터 유형을 사용하면 됩니다. 프로세서의 동작은 문서에서 서명이 감지되는지에 따라 달라집니다.

서명이 발견되면 추출기는 응답에 서명 엔티티를 반환합니다. has_signed라는 이름의 필드의 경우 응답 객체의 구조는 다음과 같습니다.

"has_signed": {
  "mention_text": "Detected",
  "confidence": <confidence_score_between 0 to 1>,
  "normalized_value": {
    "text": "Detected",
    "signature_value": true
  }
}

서명이 없으면 항목이 프로세서의 응답에 반환되지 않습니다.

키 요구사항 구성 및 설정

서명 감지를 설정하려면 다음 단계를 따르세요.

  1. 스키마 정의: 프로세서 스키마에서 감지할 서명의 새 항목을 추가합니다.
  2. 데이터 유형 설정: 이 새 항목의 데이터 유형으로 서명을 선택합니다.
  3. 메서드를 파생으로 설정: signature 데이터 유형이 있는 항목은 Derived 메서드만 사용할 수 있습니다. 모델이 시각적으로 서명의 존재를 추론하므로 텍스트 값을 추출하지 않습니다. 따라서 서명 항목에는 textAnchorpageAnchor과 같은 필드가 채워지지 않습니다.

사용 사례

계약을 처리하고 서명되었는지 확인해야 한다고 가정해 보겠습니다. is_contract_signed라는 스키마 필드를 만들고 데이터 유형을 signature로 설정할 수 있습니다. 서명된 계약을 처리하면 응답에 서명의 존재를 확인하는 is_contract_signed 항목이 포함됩니다. 서명이 없으면 이 항목이 응답에 표시되지 않습니다. 이를 통해 서명되지 않은 문서를 빠르게 검토 대상으로 표시할 수 있습니다.

다음 단계

특수 프로세서 업트레이닝에 대해 알아봅니다.