設定字元辨識專案

本頁面可協助開發人員設定 Google Distributed Cloud (GDC) 實體隔離專案,以使用光學字元辨識 (OCR) 服務。這個程序包括建立專案、啟用 OCR API、安裝用戶端程式庫、定義環境變數,以及驗證憑證。如果您是 Vertex AI 新手,請進一步瞭解字元辨識功能

使用 GDC 控制台和 gdcloud CLI 設定字元辨識專案,步驟如下:

  • GDC 控制台:啟用 OCR API,並查看服務狀態和端點。
  • gdcloud CLI:設定服務帳戶以與 OCR API 互動、安裝用戶端程式庫,以及驗證 API 要求。

建立專案

在 Distributed Cloud 資源階層結構中建立字元辨識專案,即可整理 OCR 資源,包括協作者、已啟用的 API、監控工具、帳單資訊、驗證憑證和存取權控管。

如要建立專案,請參閱「設定 Vertex AI 專案」。 進行 API 呼叫時,您需要專案 ID。

要求開發人員權限

您必須在專案中具備 AI OCR 開發人員角色,才能存取光學字元辨識功能,並產生 API 權杖以進行要求驗證和授權。

請專案 IAM 管理員在專案命名空間中,將 AI OCR 開發人員 (ai-ocr-developer) 角色授予使用者或服務帳戶。如需這個角色的相關資訊,請參閱「準備 IAM 權限」。

啟用 OCR API

您必須為專案啟用 OCR 預先訓練 API。啟用後,您就能查看 OCR 預先訓練 API 的服務狀態和端點

安裝用戶端程式庫

用戶端程式庫支援 Python 程式設計語言。建議使用這些用戶端程式庫呼叫 OCR API,因為這樣存取 API 會更輕鬆。

安裝 OCR 用戶端程式庫,並按照下列步驟操作,確保您使用的是正確版本:

  1. 檢查是否已安裝 OCR 用戶端程式庫,並取得版本號碼:

    pip freeze | grep vision
    

    如果已安裝用戶端程式庫,您會取得類似下列範例的輸出內容:

    google-cloud-vision==3.0.0
    

    您取得的版本號碼必須與下列端點的用戶端程式庫相符:

    https://GDC_URL/.well-known/static/client-libraries
    

    GDC_URL 替換為 GDC 中貴機構的網址。

  2. 如果版本號碼不相符,請解除安裝用戶端程式庫:

    pip uninstall google-cloud-vision
    
  3. 如果已解除安裝 OCR 用戶端程式庫,請指定與作業系統對應的檔案名稱,重新安裝該程式庫。

設定環境變數

安裝 OCR 用戶端程式庫後,您就可以透過 Python 指令碼與 API 互動。

如果您在專案中設定服務帳戶,以透過程式建立已獲授權的 API 呼叫,可以在 Python 指令碼中定義環境變數,以便在執行時存取服務帳戶金鑰等值。

請按照下列步驟,在 Python 指令碼中設定必要環境變數:

  1. 建立 JupyterLab 筆記本,與 OCR 預先訓練 API 互動。

  2. 在 JupyterLab 筆記本上建立 Python 指令碼。

  3. 在 Python 指令碼中新增下列程式碼:

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    APPLICATION_DEFAULT_CREDENTIALS_FILENAME 替換為包含您在專案中建立的服務帳戶金鑰的 JSON 檔案名稱,例如 my-service-key.json

  4. 將 Python 指令碼儲存為 vision.py 等名稱。

  5. 執行 Python 指令碼來設定環境變數:

    python SCRIPT_NAME
    

    SCRIPT_NAME 替換為您為 Python 指令碼提供的名稱,例如 vision.py

設定驗證方法

開始使用 OCR API 之前,請先驗證用戶端憑證,並要求帳戶存取專案資源。詳情請參閱「驗證 API 要求」。