处理文档

本快速指南介绍如何通过 ABAP SDK for Google Cloud 的 SAP BTP 版本使用 Document AI API 的批处理功能处理源 Cloud Storage 存储桶中的文档(发票),并将处理后的文档(JSON 文件)存储在目标存储桶中。

准备工作

在运行本快速入门之前,请确保您或您的管理员已满足以下前提条件:

  • 确保已在 Google Cloud 项目中启用 Document AI API。

    转到 API 库

  • 在 Document AI Workbench 中,创建类型为 INVOICE_PROCESSOR 的处理器。如需了解详情,请参阅创建和管理处理器

  • 在 Cloud Storage 中,创建源存储桶以存储要处理的账单,并将账单放入此存储桶。如需了解详情,请参阅创建存储桶

  • 在 Cloud Storage 中,创建一个目标存储桶以存储处理的文件。

创建 ABAP 类以处理文档

  1. 创建软件包:

    1. 在 ADT 中,转到 Project Explorer。
    2. 右键点击软件包 ZLOCAL,然后选择新建 > ABAP 软件包
    3. 为软件包输入以下详细信息:

      • 名称:输入 ZABAPSDK_TEST
      • 说明:输入 ABAP SDK Test Package
    4. 点击下一步

    5. 选择传输请求对话框中,选中创建新请求复选框。

    6. 输入传输请求的说明。

    7. 点击完成

  2. 创建 ABAP 类以调用 Document AI API:

    1. 右键点击 ABAP 软件包,然后选择新建 > ABAP 类
    2. 为 ABAP 类输入以下详细信息:

      • 名称:输入 ZGOOG_CL_QS_DOCUMENT_AI
      • 说明:输入 Quick start for Document AI API
    3. 点击下一步

    4. 选择传输请求,然后点击完成

  3. 在代码编辑器中,将默认代码替换为以下代码段:

     CLASS zcl_qs_process_documents DEFINITION
     PUBLIC FINAL
     CREATE PUBLIC.
    
     PUBLIC SECTION.
       INTERFACES if_oo_adt_classrun.
     ENDCLASS.
    
     CLASS zcl_qs_process_documents IMPLEMENTATION.
      METHOD if_oo_adt_classrun~main.
       DATA lv_p_projects_id   TYPE string.
       DATA lv_p_locations_id  TYPE string.
       DATA lv_p_processors_id TYPE string.
       DATA ls_input           TYPE /goog/cl_documentai_v1=>ty_017.
       DATA lo_docai           TYPE REF TO /goog/cl_documentai_v1.
    
       TRY.
    
           " Open HTTP connection
           lo_docai = NEW #( iv_key_name = 'DEMO_DOC_PROCESSING' ).
    
           " Populate relevant parameters to be passed to API
           lv_p_projects_id  = 'PROJECT_ID'.
           lv_p_locations_id = 'LOCATION_ID'.
           lv_p_processors_id = 'PROCESSOR_ID'.
           ls_input-input_documents-gcs_prefix-gcs_uri_prefix = 'SOURCE_BUCKET_URI'.
           ls_input-document_output_config-gcs_output_config-gcs_uri = 'TARGET_BUCKET_URI'.
    
           " Call API method
           lo_docai->batch_process_processors( EXPORTING iv_p_projects_id   = lv_p_projects_id
                                                         iv_p_locations_id  = lv_p_locations_id
                                                         iv_p_processors_id = lv_p_processors_id
                                                         is_input           = ls_input
                                               IMPORTING
                                                         es_output          = DATA(ls_output)
                                                         ev_ret_code        = DATA(lv_ret_code)
                                                         ev_err_text        = DATA(lv_err_text)
                                                         es_err_resp        = DATA(ls_err_resp) ).
    
           IF lo_docai->is_success( lv_ret_code ) = abap_true.
             out->write( |API call successful| ).
           ELSE.
             out->write( |Error occurred during API call| ).
             out->write( lv_err_text ).
           ENDIF.
    
           " Close HTTP connection
           lo_docai->close( ).
    
         CATCH /goog/cx_sdk INTO DATA(lo_exception).
           " Handle exception here
       ENDTRY.
      ENDMETHOD.
    ENDCLASS.
    

    替换以下内容:

    • DEMO_DOC_PROCESSING:客户端密钥名称。
    • PROJECT_ID:您的来源存储桶和目标存储桶所在的 Google Cloud 项目的 ID。
    • LOCATION_ID:处理器的位置。
    • PROCESSOR_ID:处理器的 ID。
    • SOURCE_BUCKET_URI:保留源文档以进行处理的 Cloud Storage 存储桶文件夹的 URI。
    • TARGET_BUCKET_URI:用于存储已处理文档(JSON 文件)的 Cloud Storage 存储桶的 URI。
  4. 保存并启用更改。

  5. 运行您的应用:

    1. 选择 ABAP 类 ZGOOG_CL_QS_DOCUMENT_AI
    2. 依次点击运行 > 运行方式 > ABAP 应用(控制台)。或者,按 F9
  6. 如需验证结果,请按以下步骤操作:

    1. 在 Google Cloud 控制台中,进入 Cloud Storage 存储桶页面。

      进入“存储桶”

    2. 打开目标存储桶。处理后的文档以 JSON 文件的形式存储。

后续步骤