DocAI - 일괄 프로세스 태스크

Doc AI - 일괄 프로세스 태스크를 사용하면 단일 일괄 (비동기) 요청을 Document AI 프로세서로 전송하여 여러 문서를 처리할 수 있습니다. 그러면 Document AI가 장기 실행 작업(LRO)을 시작하고 처리된 결과를 Cloud Storage 버킷에 저장합니다. Document AI 프로세서는 문서의 분류, 분할, 파싱, 분석과 같은 다양한 문서 처리 작업을 수행하는 Cloud Document AI 구성요소입니다.

Cloud Document AI는 자연어, 컴퓨터 비전, 번역, AutoML 등 최첨단 Google AI를 사용하여 구조화되지 않았거나 반구조화된 문서에서 구조화된 정보를 파싱할 수 있는 Google Cloud 서비스입니다.

시작하기 전에

Doc AI - 일괄 프로세스 태스크를 구성하기 전에 Google Cloud 프로젝트에서 다음 태스크를 수행해야 합니다.

  1. Cloud Document AI API(documentai.googleapis.com)를 사용 설정합니다.

    Cloud Document AI API 사용 설정

  2. 인증 프로필을 만듭니다. Apigee Integration은 인증 프로필을 사용하여 Doc AI - 일괄 프로세스 태스크의 인증 엔드포인트에 연결합니다.

Doc AI - 일괄 프로세스 태스크 구성

  1. Apigee UI에서 Apigee 조직을 선택합니다.
  2. 개발 > 통합을 클릭합니다.
  3. 기존 통합을 선택하거나 통합 만들기를 클릭하여 새 통합을 만듭니다.

    새 통합을 만드는 경우:

    1. 통합 만들기 대화상자에 이름과 설명을 입력합니다.
    2. 지원되는 리전 목록에서 통합에 대한 리전을 선택합니다.
    3. 만들기를 클릭합니다.

    통합 디자이너 페이지에서 통합이 열립니다.

  4. 통합 설계자 탐색 메뉴에서 +태스크/트리거 추가 > 태스크를 클릭하여 사용 가능한 태스크 목록을 봅니다.
  5. Doc AI - 일괄 프로세스 요소를 클릭하여 통합 디자이너에 배치합니다.
  6. 디자이너에서 Doc AI - 일괄 프로세스 요소를 클릭하여 Doc AI - 일괄 프로세스 태스크 구성 창을 표시합니다.
  7. 인증으로 이동하고 사용하려는 기존 인증 프로필을 선택합니다.

    선택사항입니다. 태스크를 구성하기 전에 인증 프로필을 만들지 않았으면 + 새 인증 프로필을 클릭하고 새 인증 프로필 만들기에 설명된 단계를 따릅니다.

  8. 태스크 입력으로 이동하고 다음 태스크 입력 매개변수 표를 사용해 표시된 입력 필드를 구성합니다.

    입력 필드의 변경사항은 자동으로 저장됩니다.

태스크 입력 매개변수

다음 표에서는 Doc AI - 일괄 프로세스 태스크의 입력 매개변수를 설명합니다.

속성 데이터 유형 설명
리전 문자열 프로세서의 Cloud Document AI 위치입니다. 예를 들어 us는 미국입니다.
ProjectsId 문자열 Google Cloud 프로젝트 ID입니다.
ProcessorsId문자열 커스텀 프로세서의 ID입니다.
요청 JSON JSON 구조 요청을 참조하세요.

태스크 출력

Doc AI - 일괄 프로세스 태스크는 다음 샘플 출력과 유사한 장기 실행 작업(LRO)의 이름을 반환합니다.

{
    "name": "projects/[PROJECT_ID]/locations/[LOCATION]/operations/[OPERATION_ID]"
}

오류 처리 전략

태스크의 오류 처리 전략은 일시적인 오류로 인해 태스크가 실패할 경우 수행할 태스크를 지정합니다. 오류 처리 전략을 사용하는 방법과 다양한 유형의 오류 처리 전략에 대한 자세한 내용은 오류 처리 전략을 참조하세요.

다음 단계

  1. 에지 및 에지 조건 추가
  2. 통합 테스트 및 게시
  3. 트리거 구성
  4. 데이터 매핑 태스크 추가
  5. Google Cloud 서비스의 모든 태스크 참조