本頁面說明如何設定專案,以便使用 Speech-to-Text 服務。這個程序包括建立專案、啟用 Speech-to-Text API、安裝用戶端程式庫、定義環境變數,以及驗證憑證。如果您是 Vertex AI 新手,請進一步瞭解語音辨識功能。
您可以使用 GDC 控制台和 gdcloud CLI 設定語音辨識專案,步驟如下:
- GDC 控制台:啟用 Speech-to-Text API,並查看服務狀態和端點。
- gdcloud CLI:設定服務帳戶,與 Speech-to-Text API 互動、安裝用戶端程式庫,以及驗證 API 要求。
建立專案
建立語音辨識專案可整理 Speech-to-Text 資源,包括協作者、已啟用的 API、驗證憑證和存取權控管。
如要建立專案,請參閱「設定 Vertex AI 專案」。 進行 API 呼叫時,您需要專案 ID。
要求開發人員權限
您必須具備專案的 AI Speech 開發人員角色,才能存取語音辨識功能,並產生 API 權杖以進行要求驗證和授權。
請專案 IAM 管理員在專案命名空間中,將 AI Speech 開發人員 (ai-speech-developer
) 角色授予使用者或服務帳戶。如需這個角色的相關資訊,請參閱「準備 IAM 權限」。
啟用 Speech-to-Text API
您必須為專案啟用 Speech-to-Text 預先訓練 API。啟用後,您就能查看 Speech-to-Text 預先訓練 API 的服務狀態和端點。
安裝用戶端程式庫
用戶端程式庫支援 Python 程式設計語言。建議使用這些用戶端程式庫呼叫 Speech-to-Text API,因為這樣存取 API 會更輕鬆。
安裝 Speech-to-Text 用戶端程式庫,然後按照下列步驟操作,確保您使用的是正確版本:
檢查是否已安裝 Speech-to-Text 用戶端程式庫,並取得版本號碼:
pip freeze | grep speech
如果已安裝用戶端程式庫,您會取得類似下列範例的輸出內容:
google-cloud-speech==2.15.0
您取得的版本號碼必須與下列端點的用戶端程式庫相符:
https://GDC_URL/.well-known/static/client-libraries
將
GDC_URL
替換為 GDC 中貴機構的網址。如果版本號碼不相符,請解除安裝用戶端程式庫:
pip uninstall google-cloud-speech
如果已解除安裝 Speech-to-Text 用戶端程式庫,請指定與作業系統對應的檔案名稱,重新安裝該程式庫。
設定環境變數
安裝 Speech-to-Text 用戶端程式庫後,您就可以透過 Python 指令碼與 API 互動。
如果您在專案中設定服務帳戶,以透過程式建立已獲授權的 API 呼叫,可以在 Python 指令碼中定義環境變數,以便在執行時存取服務帳戶金鑰等值。
請按照下列步驟,在 Python 指令碼中設定必要環境變數:
建立 Python 指令碼。
在 Python 指令碼中新增下列程式碼:
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
將
APPLICATION_DEFAULT_CREDENTIALS_FILENAME
替換為包含您在專案中建立的服務帳戶金鑰的 JSON 檔案名稱,例如my-service-key.json
。將 Python 指令碼儲存為
speech.py
等名稱。執行 Python 指令碼來設定環境變數:
python SCRIPT_NAME
將
SCRIPT_NAME
替換為您為 Python 指令碼提供的名稱,例如speech.py
。
設定驗證方法
開始使用 Speech-to-Text API 之前,請先驗證用戶端憑證,並要求存取專案資源的帳戶。詳情請參閱「驗證 API 要求」。