处理文档

本快速指南介绍如何通过 SAP BTP 版本的 ABAP SDK for Google Cloud,使用 Document AI API 的批处理功能处理源 Cloud Storage 存储桶中的文档(发票),并将处理后的文档(JSON 文件)存储在目标存储桶中。

准备工作

在运行本快速入门之前,请确保您或您的管理员已满足以下前提条件:

  • 确保已在您的 Google Cloud 项目中启用 Document AI API。

    转到 API 库

  • 在 Document AI Workbench 中,创建类型为 INVOICE_PROCESSOR 的处理器。如需了解详情,请参阅创建和管理处理器

  • 在 Cloud Storage 中,创建源存储桶以存储要处理的账单,并将账单放入此存储桶。如需了解详情,请参阅创建存储桶

  • 在 Cloud Storage 中,创建一个目标存储桶以存储处理的文件。

创建 ABAP 类以处理文档

  1. 创建软件包:

    1. 在 ADT 中,转到 Project Explorer。
    2. 右键点击软件包 ZLOCAL,然后选择新建 > ABAP 软件包
    3. 为软件包输入以下详细信息:

      • 名称:输入 ZABAPSDK_TEST
      • 说明:输入 ABAP SDK Test Package
    4. 点击下一步

    5. 选择传输请求对话框中,选中创建新请求复选框。

    6. 输入传输请求的说明。

    7. 点击完成

  2. 创建 ABAP 类以调用 Document AI API:

    1. 右键点击 ABAP 软件包,然后选择新建 > ABAP 类
    2. 为 ABAP 类输入以下详细信息:

      • 名称:输入 ZGOOG_CL_QS_DOCUMENT_AI
      • 说明:输入 Quick start for Document AI API
    3. 点击下一步

    4. 选择传输请求,然后点击完成

  3. 在代码编辑器中,将默认代码替换为以下代码段:

    " --------------------------------------------------------------------
    "  Copyright 2024 Google LLC                                         -
    "                                                                    -
    "  Licensed under the Apache License, Version 2.0 (the "License");   -
    "  you may not use this file except in compliance with the License.  -
    "  You may obtain a copy of the License at                           -
    "      https://www.apache.org/licenses/LICENSE-2.0                   -
    "  Unless required by applicable law or agreed to in writing,        -
    "  software distributed under the License is distributed on an       -
    "  "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND,      -
    "  either express or implied.                                        -
    "  See the License for the specific language governing permissions   -
    "  and limitations under the License.                                -
    " --------------------------------------------------------------------
    CLASS zcl_qs_process_documents DEFINITION
      PUBLIC FINAL
      CREATE PUBLIC.
    
      PUBLIC SECTION.
        INTERFACES if_oo_adt_classrun.
    ENDCLASS.
    
    
    
    CLASS ZCL_QS_PROCESS_DOCUMENTS IMPLEMENTATION.
    
    
      METHOD if_oo_adt_classrun~main.
        DATA lv_p_projects_id   TYPE string.
        DATA lv_p_locations_id  TYPE string.
        DATA lv_p_processors_id TYPE string.
        DATA ls_input           TYPE /goog/cl_documentai_v1=>ty_017.
        DATA lo_docai           TYPE REF TO /goog/cl_documentai_v1.
    
        TRY.
    
            " Open HTTP connection
            " The client key DEMO_DOC_PROCESSING is an example, replace this with actual value
            lo_docai = NEW #( iv_key_name = 'DEMO_DOC_PROCESSING' ).
    
            " Populate relevant parameters to be passed to API
            lv_p_projects_id  = 'PROJECT_ID'.
            lv_p_locations_id = 'LOCATION_ID'.
            lv_p_processors_id = 'PROCESSOR_ID'.
            ls_input-input_documents-gcs_prefix-gcs_uri_prefix = 'SOURCE_BUCKET_URI'.
            ls_input-document_output_config-gcs_output_config-gcs_uri = 'TARGET_BUCKET_URI'.
    
            " Call API method
            lo_docai->batch_process_processors( EXPORTING iv_p_projects_id   = lv_p_projects_id
                                                          iv_p_locations_id  = lv_p_locations_id
                                                          iv_p_processors_id = lv_p_processors_id
                                                          is_input           = ls_input
                                                IMPORTING
                                                          es_output          = DATA(ls_output)
                                                          ev_ret_code        = DATA(lv_ret_code)
                                                          ev_err_text        = DATA(lv_err_text)
                                                          es_err_resp        = DATA(ls_err_resp) ).
    
            IF lo_docai->is_success( lv_ret_code ) = abap_true.
              out->write( |API call successful| ).
            ELSE.
              out->write( |Error occurred during API call| ).
              out->write( lv_err_text ).
            ENDIF.
    
            " Close HTTP connection
            lo_docai->close( ).
    
          CATCH /goog/cx_sdk INTO DATA(lo_exception).
            " Handle exception here
        ENDTRY.
      ENDMETHOD.
    ENDCLASS.
    

    替换以下内容:

    • DEMO_DOC_PROCESSING:客户端密钥名称。
    • PROJECT_ID:已启用 Document AI API 的 Google Cloud 项目的 ID。
    • LOCATION_ID:处理器的位置。
    • PROCESSOR_ID:处理器的 ID。
    • SOURCE_BUCKET_URI:保留源文档以进行处理的 Cloud Storage 存储桶文件夹的 URI。
    • TARGET_BUCKET_URI:用于存储已处理文档(JSON 文件)的 Cloud Storage 存储桶的 URI。
  4. 保存并启用更改。

  5. 运行您的应用:

    1. 选择 ABAP 类 ZGOOG_CL_QS_DOCUMENT_AI
    2. 依次点击运行 > 运行方式 > ABAP 应用(控制台)。或者,按 F9
  6. 如需验证结果,请按以下步骤操作:

    1. 在 Google Cloud 控制台中,前往 Cloud Storage 存储分区页面。

      进入“存储桶”

    2. 打开目标存储桶。处理后的文档以 JSON 文件的形式存储。

后续步骤