設定字元辨識專案

本頁面可協助開發人員設定 Google Distributed Cloud (GDC) 實體隔離裝置專案,以使用光學字元辨識 (OCR) 服務。這個程序包括建立專案、啟用 OCR API、安裝用戶端程式庫、定義環境變數,以及驗證憑證。如果您是 Vertex AI 新手,請進一步瞭解字元辨識功能

使用 GDC 控制台和 gdcloud CLI 設定字元辨識專案,步驟如下:

  • GDC 控制台:啟用 OCR API,並查看服務狀態和端點。
  • gdcloud CLI:設定服務帳戶以與 OCR API 互動、安裝用戶端程式庫,以及驗證 API 要求。

建立專案

建立字元辨識專案可整理 OCR 資源,包括協作者、已啟用的 API、驗證憑證和存取權控管。

如要建立專案,請參閱「設定 Vertex AI 專案」。 進行 API 呼叫時,您需要專案 ID。

要求開發人員權限

您必須在專案中具備 AI OCR 開發人員角色,才能存取光學字元辨識功能,並產生 API 權杖以進行要求驗證和授權。

請專案 IAM 管理員在專案命名空間中,將 AI OCR 開發人員 (ai-ocr-developer) 角色授予使用者或服務帳戶。如需這個角色的相關資訊,請參閱「準備 IAM 權限」。

啟用 OCR API

您必須為專案啟用 OCR 預先訓練 API。啟用後,您就能查看 OCR 預先訓練 API 的服務狀態和端點

安裝用戶端程式庫

用戶端程式庫支援 Python 程式設計語言。建議使用這些用戶端程式庫呼叫 OCR API,因為這樣存取 API 會更輕鬆。

安裝 OCR 用戶端程式庫,並按照下列步驟操作,確保您使用的是正確版本:

  1. 檢查是否已安裝 OCR 用戶端程式庫,並取得版本號碼:

    pip freeze | grep vision
    

    如果已安裝用戶端程式庫,您會取得類似下列範例的輸出內容:

    google-cloud-vision==3.0.0
    

    您取得的版本號碼必須與下列端點的用戶端程式庫相符:

    https://GDC_URL/.well-known/static/client-libraries
    

    GDC_URL 替換為 GDC 中貴機構的網址。

  2. 如果版本號碼不相符,請解除安裝用戶端程式庫:

    pip uninstall google-cloud-vision
    
  3. 如果已解除安裝 OCR 用戶端程式庫,請指定與作業系統對應的檔案名稱,重新安裝該程式庫。

設定環境變數

安裝 OCR 用戶端程式庫後,您就可以透過 Python 指令碼與 API 互動。

如果您在專案中設定服務帳戶,以透過程式建立已獲授權的 API 呼叫,可以在 Python 指令碼中定義環境變數,以便在執行時存取服務帳戶金鑰等值。

請按照下列步驟,在 Python 指令碼中設定必要環境變數:

  1. 建立 Python 指令碼。

  2. 在 Python 指令碼中新增下列程式碼:

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    APPLICATION_DEFAULT_CREDENTIALS_FILENAME 替換為包含您在專案中建立的服務帳戶金鑰的 JSON 檔案名稱,例如 my-service-key.json

  3. 將 Python 指令碼儲存為 vision.py 等名稱。

  4. 執行 Python 指令碼來設定環境變數:

    python SCRIPT_NAME
    

    SCRIPT_NAME 替換為您為 Python 指令碼提供的名稱,例如 vision.py

設定驗證方法

開始使用 OCR API 之前,請先驗證用戶端憑證,並要求帳戶存取專案資源。詳情請參閱「驗證 API 要求」。