Document AI 개요

이 문서는 Document AI 사용에 관한 기본 개념을 설명하는 가이드입니다. 다른 문서 또는 빠른 시작으로 이동하기 전에 이 페이지를 읽어야 합니다.

문서 처리 워크플로 자동화

전 세계 비즈니스는 정보를 저장하고 전달하는 데 문서를 많이 사용합니다. 이러한 정보가 유용하게 사용되려면 디지털화해야 하는 경우가 많습니다. 하지만 일반적으로 시간 소모가 많은 수동 프로세스를 통해 이루어집니다.

예를 들면 다음과 같습니다.

  • 전자책용으로 도서를 디지털화합니다.
  • 병원에서 의료 접수 양식을 처리합니다.
  • 경비 보고서 검증을 위해 영수증 및 인보이스를 파싱합니다.
  • 신분증을 기반으로 ID를 인증합니다.
  • 대출 승인을 위해 세금 양식에서 소득 정보를 추출합니다.
  • 주요 비즈니스 계약 약관에 대한 계약 이해

이러한 각 워크플로에는 문서에서 원시 텍스트를 가져온 후 필요한 데이터 (필드 또는 항목)에 해당하는 텍스트에서 특정 텍스트를 추출하는 작업이 포함됩니다. 하지만 문서 유형마다 구조와 레이아웃이 다르며 필드 패턴은 특정 사용 사례에 따라 다릅니다.

Document AI 구성요소

Document AI는 문서에서 비정형 데이터를 가져와서 정형 데이터 (데이터베이스에 적합한 특정 필드)로 변환하여 보다 쉽게 이해하고 분석하고 사용할 수 있도록 해주는 문서 처리 및 이해 플랫폼입니다.

Document AI는 생성형 AI를 사용하여 Vertex AI 내의 제품 위에 구축되어 있어 전문적인 머신러닝 지식 없이도 확장 가능한 엔드 투 엔드 클라우드 기반 문서 처리 애플리케이션을 만들 수 있습니다.

Document AI를 사용하면 다음 작업을 할 수 있습니다.

  • OCR을 사용하여 문서를 디지털화하여 텍스트, 레이아웃, 이미지 품질 감지 (가독성 향상), 기울기 보정 (완전 자동)과 같은 다양한 부가기능을 가져옵니다.
  • 문서 파일에서 텍스트 및 레이아웃 정보를 추출하고 항목을 정규화합니다.
  • 구조화된 양식 및 일반 표에서 키-값 쌍 (kvp)을 식별합니다. 예를 들면 Name: Jill Smith는 kvp입니다.
  • 문서 유형을 분류하여 추출 및 저장과 같은 다운스트림 프로세스를 실행합니다.
  • 문서를 유형별로 분할하고 분류합니다. 예를 들어 여러 실제 문서가 포함된 PDF 파일)
  • 자동 라벨 지정, 스키마 관리, 문서 및 예측 검토와 같은 데이터 세트 관리 기능을 사용하여 미세 조정 및 모델 평가에 사용할 데이터 세트를 준비합니다.
  • Cloud Storage, BigQuery, Vertex AI Search와 같은 제품과 통합하여 문서 및 메타데이터를 저장, 검색, 구성, 관리, 분석할 수 있습니다.

이 다이어그램은 Document AI에서 지원하는 모든 주요 문서 처리 단계와 각 단계가 서로 연결되는 방식을 보여줍니다.

docai-overview-1

프로세서

Document AI 프로세서는 문서 파일과 문서 처리 및 이해 작업을 실행하는 머신러닝 모델 사이에 있습니다. 문서를 분류, 분할, 파싱 또는 분석하는 데 사용할 수 있습니다.

각 Google Cloud 프로젝트는 자체 프로세서 인스턴스를 만들어야 합니다.

프로세서는 다음 카테고리 중 하나에 속합니다.

  • 디지타이즈: OCR입니다.
  • 추출: 맞춤 추출기, 양식 파서, 레이아웃 파서, 사전 학습된 파서
  • 분류: 맞춤 분류 기준 및 맞춤 분할기

Document AI에서 사용할 수 있는 모든 프로세서 유형에 관한 자세한 내용은 전체 프로세서 및 세부정보 목록을 참고하세요.

어떤 프로세서를 사용해야 하나요?

특정 애플리케이션에 사용할 프로세서 유형을 결정하려면 다음과 같은 일반적인 가이드라인을 따르세요.

카테고리 사용 사례 프로세서 유형
디지털화 문서에서 텍스트 및 레이아웃 정보를 추출합니다. Enterprise Document OCR
문서의 스캔된 이미지 품질 (가독성)을 분석합니다. 이미지 품질 분석 이 사용 설정된 Enterprise Document OCR
맞춤 프로세서 기준을 충족하지 않는 맞춤 문서에서 항목을 추출합니다.
추출 문서의 구조화된 양식에서 표 또는 kvp를 추출합니다. 양식 파서
문서의 텍스트, 표, 목록과 같은 요소를 추출하고 컨텍스트 인식 청크를 반환합니다. 레이아웃 파서
커스텀 프로세서 기준을 충족하는 맞춤 문서에서 항목을 추출합니다. 맞춤 추출기 만들기
특수 문서 유형에서 항목을 추출합니다. 사전 학습된 프로세서 (품질을 개선하기 위해 업트레이닝)
분류 문서 분류 맞춤 분류기 만들기
문서 분할 맞춤 분할기 만들기

이 다이어그램은 각 사용 사례에 가장 적합한 프로세서를 결정하는 데 도움이 됩니다.

docai-overview-2

Document AI 프로세서 사용

Document AI를 사용하여 문서 처리를 시작하는 주요 단계는 다음과 같습니다.

  1. 사용 사례에 적합한 프로세서를 선택합니다.

  2. Google Cloud 콘솔 또는 Document AI API를 사용하여 프로세서를 만듭니다.

    • Document AI는 문서를 전송할 수 있는 예측 엔드포인트를 만듭니다.

    • 자세한 내용은 프로세서 만들기를 참고하세요.

  3. 학습 및 테스트 데이터를 사용하여 처음부터 프로세서를 학습하거나 기존 프로세서를 기반으로 새 (사전 학습된) 프로세서 버전을 업트레이닝합니다.

  4. 처리를 위해 문서를 보내주세요.