ドキュメントを処理する

このクイックスタートでは、ソースバケットからのドキュメント(請求書)を処理し、処理されたドキュメント(JSON ファイル)をバッチ処理機能によって Document AI API のターゲット バケットに格納する方法について説明します。

始める前に

このクイックスタートを実行する前に、自身または管理者によって次の事前準備が完了していることを確認してください。

  • Google Cloud プロジェクトで Document AI API が有効になっていることを確認する。

    API ライブラリに移動

  • Document AI Workbench で、INVOICE_PROCESSOR タイプのプロセッサを作成します。詳細については、プロセッサの作成と管理をご覧ください。

  • Cloud Storage で、処理する請求書を保存するソースバケットを作成し、そのバケットに請求書を配置します。詳細については、バケットを作成するをご覧ください。

  • Cloud Storage で、処理されたファイルを保存するターゲット バケットを作成します。

ドキュメントを処理するプログラムを作成する

  1. SAP システムで、トランザクション SE38 を使用して、カスタム名前空間(Z や Y など)に実行可能プログラムを作成します。

    1. SAP GUI で、トランザクション コード SE38 を入力します。

    2. [Program] フィールドに、プログラムの名前を入力します(例: ZDEMO_DOCUMENT_AI)。

    3. [Create] をクリックします。

    4. プログラムの属性を指定します。

      1. [Title] フィールドに、プログラムのタイトル(例: Process invoices)を入力します。

      2. [Type] フィールドで Executable Program を選択します。

      3. [Save] をクリックします。

    5. プログラムをローカル オブジェクトとして保存します。

    6. ABAP エディタで、次のコードを追加します。

      **********************************************************************
      *  Copyright 2023 Google LLC                                         *
      *                                                                    *
      *  Licensed under the Apache License, Version 2.0 (the "License");   *
      *  you may not use this file except in compliance with the License.  *
      *  You may obtain a copy of the License at                           *
      *      https://www.apache.org/licenses/LICENSE-2.0                   *
      *  Unless required by applicable law or agreed to in writing,        *
      *  software distributed under the License is distributed on an       *
      *  "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND,      *
      *  either express or implied.                                        *
      *  See the License for the specific language governing permissions   *
      *  and limitations under the License.                                *
      **********************************************************************
      
      REPORT zr_qs_process_documents.
      
      * data declarations
      DATA:
        lv_p_projects_id   TYPE string,
        lv_p_locations_id  TYPE string,
        lv_p_processors_id TYPE string,
        ls_input           TYPE /goog/cl_documentai_v1=>ty_017.
      
      TRY.
      
      * open http connection
          DATA(lo_client) = NEW /goog/cl_documentai_v1( iv_key_name = 'DEMO_DOC_PROCESSING' ).
      
      * populate relevant parameters
          lv_p_projects_id  = 'PROJECT_ID'.
          lv_p_locations_id = 'LOCATION_ID'.
          lv_p_processors_id = 'PROCESSOR_ID'.
          ls_input-input_documents-gcs_prefix-gcs_uri_prefix = 'SOURCE_BUCKET_URI'.
          ls_input-document_output_config-gcs_output_config-gcs_uri = 'TARGET_BUCKET_URI'.
      
      * call api method
          CALL METHOD lo_client->batch_process_processors
            EXPORTING
              iv_p_projects_id   = lv_p_projects_id
              iv_p_locations_id  = lv_p_locations_id
              iv_p_processors_id = lv_p_processors_id
              is_input           = ls_input
            IMPORTING
              es_output          = DATA(ls_output)
              ev_ret_code        = DATA(lv_ret_code)
              ev_err_text        = DATA(lv_err_text)
              es_err_resp        = DATA(ls_err_resp).
      
          IF lo_client->is_success( lv_ret_code ).
            MESSAGE 'Success' TYPE 'S'.
          ELSE.
            MESSAGE lv_err_text TYPE 'E'.
          ENDIF.
      
      * close http connection
          lo_client->close( ).
      
        CATCH /goog/cx_sdk INTO DATA(lo_exception).
          MESSAGE lo_exception->get_text( ) TYPE 'E'.
      ENDTRY.
      

      次のように置き換えます。

      • DEMO_DOC_PROCESSING: クライアント キー名。
      • PROJECT_ID: Google Cloud プロジェクトの ID。
      • LOCATION_ID: プロセッサのロケーション。
      • PROCESSOR_ID: プロセッサの ID。
      • SOURCE_BUCKET_URI: 処理するソース ドキュメントのある Cloud Storage バケット フォルダの URI。
      • TARGET_BUCKET_URI: 処理されたドキュメント(JSON ファイル)が保存される Cloud Storage バケットの URI。
  2. SE38 でアプリを実行します。

  3. 結果を検証するには、次の操作を行います。

    1. Google Cloud コンソールで、Cloud Storage の [バケット] ページに移動します。

    2. ターゲット バケットを開きます。処理されたドキュメントが JSON ファイル形式で保存されています。

次のステップ