Cloud Data Fusion에서 Document AI로 지원되는 인보이스 파서 플러그인을 사용하여 인보이스를 구조화된 데이터로 변환할 수 있습니다. 구조화된 데이터는 BigQuery에 저장됩니다.
시작하기 전에
인보이스를 파싱하기 전에 Cloud Data Fusion 인스턴스가 6.4.1 이상으로 실행되어야 합니다. 자세한 내용은 Cloud Data Fusion 인스턴스 업그레이드를 참조하세요.
프로세서 만들기
Google Cloud Console에서 Document AI Processors 페이지로 이동합니다.
프로세서를 만듭니다.. 프로세서 유형으로 인보이스 파서를 선택합니다.
인보이스 파서 플러그인 구성
Google Cloud Console에서 Cloud Data Fusion 인스턴스 페이지를 엽니다.
원하는 인스턴스가 버전 6.4.1 이상으로 업그레이드되었는지 확인합니다. 이전 버전의 경우 인스턴스를 업그레이드합니다.
인스턴스 보기를 클릭합니다. Cloud Data Fusion UI가 열립니다.
허브를 클릭합니다.
GCP를 클릭한 후 GCP 플러그인을 배포합니다.
DocAI를 클릭한 후 Doc AI 플러그인을 배포합니다.
인보이스 파서 빠른 시작 > 만들기를 클릭합니다.
인보이스 파서 프로세서 ID, Cloud Storage 버킷 경로, BigQuery 테이블 세부정보를 입력하여 파이프라인을 맞춤설정합니다.
파이프라인을 배포 및 실행합니다.
파싱된 인보이스가 BigQuery의 출력 테이블에 저장됩니다.
인보이스의 메타데이터가 Metadata
테이블에 저장되고 원시 인보이스의 파싱 상태, Cloud Storage 경로, 업로드 타임스탬프를 포함합니다. 출력 및 메타데이터 테이블의 레코드를 invoice_uuid
키와 조인할 수 있습니다.