개념

다음은 이 제품에 사용되는 몇 가지 개념과 기능입니다.

개념 정의
검토 추출된 필드 값을 문서의 실제 값과 시각적으로 비교하고 잘못된 추출을 수정하거나 DocAI 프로세서에서 누락된 추출 필드를 추가하는 프로세스입니다.
라벨러 추출된 문서를 검토하는 사람입니다. 고객은 자체 인력 (Bring-your-own-labeler 또는 BYOL)을 사용하거나 Google 라벨러를 사용하여 HITL 검토를 수행할 수 있습니다.
작업 라벨러가 검토하는 추출된 문서의 대기열입니다. 프로세서는 HITL 검토용으로 구성된 경우 단일 작업을 생성합니다.
라벨러 워크벤치 라벨러가 문서를 검토하는 데 사용하는 UI입니다. UI에는 라벨러가 검토하고, 수정하고, 제출하거나 거부할 수 있는 대기열의 문서가 표시됩니다.
  • BYOL 라벨러는 라벨링 UI에 액세스하려면 Google Workforce 또는 Gmail 계정이 있어야 합니다.
  • 라벨러는 작업 할당 시 라벨링 관리자가 이메일로 보낸 링크를 통해 워크벤치에 액세스할 수 있습니다.
Answer Time(응답 시간) 라벨러가 문서를 처리하는 데 걸린 시간입니다. 라벨러 워크벤치는 문서 제출 시간을 추적하고 효율성 분석 (예: 각 라벨러 문서 검토)을 제공합니다.
라벨 지정 관리자 하나 이상의 라벨링 관리자가 라벨러 풀에 할당되어 다음 작업을 할 수 있습니다.
  • 라벨러 풀에 라벨러를 추가하거나 삭제합니다.
  • 라벨러에게 작업을 할당하거나 할당 해제합니다. 프로젝트의 모든 작업은 라벨러 관리자가 액세스할 수 있습니다. 작업의 우선순위가 변경되면 라벨러에 대한 작업 할당이 변경될 수 있습니다.
  • 라벨러가 할당된 다음 작업을 처리할 수 있도록 작업을 일시중지합니다.
BYOL 시나리오에서는 라벨링 관리자가 고객에 의해 제공됩니다. Google 라벨러를 사용하는 경우 Google에서 라벨링 관리자를 제공합니다.
라벨링 관리자 콘솔 라벨링 관리자가 라벨러 풀 및 작업 할당을 관리하는 데 사용하는 UI입니다. 콘솔 열기
작업에서 대기열에 추가됨, 응답됨, 완료됨, 거부됨 문서 작업은 지속적인 워크플로입니다. 문서는 다음 상태를 거칩니다.
  • 대기열에 추가됨 - 문서가 프로세서에 의해 처리되면 HITL 작업에 enqueued됩니다 (추가됨).
  • 답변됨 - 라벨러가 문서를 검토하고 수정하여 제출하면 완료되어 고객이 구성한 Cloud Storage 버킷에 저장됩니다.
  • 완료됨 - 작업에 복제가 활성화된 경우 (작업의 각 문서에 여러 라벨러가 작업) 모든 라벨러가 문서에 답변한 경우입니다. 작업에 복제가 없는 경우 ( 단일 라벨러가 검토함) AnsweredCompleted와 동일합니다.
  • 거부됨 - 문서가 잘못되었거나 (다른 문서 유형, 위조 등) 품질이 좋지 않은 경우 (빛 반사, 가장자리 잘림 등) 문서가 거부될 수 있습니다.
프로세서당 단일 작업 프로세서당 여러 작업은 지원되지 않습니다. 고객이 여러 작업에서 단일 문서 유형 (예: 인보이스)을 처리해야 하는 경우 HITL 검토를 사용하여 여러 프로세서를 구성할 수 있습니다.
작업 할당과 라벨러 풀의 차이점 라벨링 관리자가 풀에 라벨러를 추가합니다. 추가되면 풀의 모든 라벨러를 작업에 할당할 수 있습니다. '라벨러 풀'은 작업에 할당된 라벨러 '그룹'과 혼동해서는 안 됩니다. 풀은 프로젝트 수준에서 관리되며 분석 및 작업에 대한 라벨러 액세스 권한을 결정하는 데 사용됩니다. 풀의 모든 라벨러는 프로젝트의 하나 이상의 작업에 할당될 수 있습니다.
라벨러 풀 라벨러 풀은 프로젝트 수준에서 생성되며 작업 할당과 혼동해서는 안 됩니다. 라벨링 관리자는 태스크에 할당된 모든 라벨러를 할당할 수 있으므로 여러 라벨러가 문서를 병렬로 검토하고 태스크를 더 빠르게 완료할 수 있습니다. 라벨러 풀은 고객이 프로젝트의 모든 작업에 할당할 수 있습니다.
검증 필터 및 기준점 추출된 필드에는 DocAI 추출이 정확하다는 신뢰도를 나타내는 신뢰도 점수 (0~100)가 있습니다. 고객은 각 필드의 유효성 검사 기준을 구성하여 이 유효성 검사 기준 미만의 필드가 있는 페이지만 검토를 위해 대기열에 추가할 수 있습니다. 기준 이상의 필드는 대기열에 추가되지 않습니다. 고객이 구성할 수 있는 유효성 검사 필터에는 세 가지 유형이 있습니다.
  • 필드 수준 필터 - 검토해야 하는 중요한 필드를 선택하고 각 필드의 신뢰도 임곗값을 지정합니다. 이 기준이 필드에 대해 100% 로 설정되면 이 필드가 포함된 모든 페이지가 검토를 위해 전송됩니다.
  • 문서 수준 필터 - 전체 문서 수준 신뢰도 임곗값을 선택합니다. 필드가 기준점 미만이면 전체 페이지가 검토를 위해 전송됩니다. 이 기준이 100%로 설정되면 예측된 모든 문서가 검토를 위해 전송됩니다.
  • 필터 없음 - HITL 엔드포인트에 게시된 모든 문서가 검토를 위해 전송됩니다.
라벨러 관리자 분석 라벨 지정 관리자는 대기열에 추가됨, 답변됨, 건너뜀, 완료됨, 평균 처리 시간/문서, 총 답변 시간 등 각 작업과 각 라벨 지정자의 분석을 확인할 수 있습니다. 분석은 라벨링 관리자 콘솔의 분석 탭에서 액세스할 수 있습니다.