定價

系統每個月都會依據 Speech-to-Text 成功處理完的音訊長度,以 15 秒為單位累加,向您收取服務使用費用。

下方的價目表適用於個人系統 (例如手機、平板電腦、筆記型電腦和桌上型電腦) 上的應用程式。如要在汽車、電視、家電用品或喇叭等嵌入式裝置上使用 Speech-to-Text API,請與我們聯絡以取得核准,並瞭解計費方式。

您可以在 Cloud Console 中查看目前的帳單狀態,包括用量和當期帳單資料。如要進一步瞭解如何管理帳戶,請參閱 Cloud Billing 說明文件帳單與付款支援相關說明。

價目表

功能 標準版模型
(強化版影片和語音通話模型以外的所有模型)
強化版模型
(影片和語音通話)
0 至 60 分鐘 61 分鐘以上,100 萬分鐘以下 0 至 60 分鐘 61 分鐘以上,100 萬分鐘以下
語音辨識 (未啟用資料記錄功能 - 預設值) 免費 每 15 秒 $0.006 美元** 免費 每 15 秒 $0.009 美元**
語音辨識 (已啟用資料記錄功能) 免費 每 15 秒 $0.004 美元** 免費 每 15 秒 $0.006 美元**

** 每項要求的時間都會進位至最接近的 15 秒倍數。

計費因素

Speech-to-Text 所適用的費率取決於下列要素:

強化版模型

Speech-to-Text 提供多種可用於進行語音辨識工作的機器學習模型。其中,強化版語音通話模型和影片模型專為其各自用途所打造,因此可提供更佳的辨識成效,正確使用時也可產生更優質的辨識結果。請參閱支援的語言頁面,瞭解您的語言是否有適用的強化版模型。

資料記錄

如果您選擇啟用資料記錄功能,Google 即可錄製傳送至 Speech-to-Text 的音訊資料。接著,Google 會使用這類資料改善語音轉錄機器學習模型。客戶只要選擇啟用資料記錄功能,就能以更划算的價格使用 Speech-to-Text。

多個聲道

不同的音訊聲道會分開計費。如果您傳送的要求中包含多個聲道,系統將依照所有聲道中經處理的音訊總長度向您收費。這種依時間計費的方式與追蹤每月用量限制的方式不同。用量限制僅會計入音訊檔案的時間長度,不受聲道數量影響。舉例來說,如果您傳送的要求中包含 30 秒的音訊和 4 個聲道,系統會向您收取 120 秒的費用,但只有 30 秒會計入您的每月配額。詳情請參閱配額與限制頁面。

費用計算

每項要求的執行時間都會進位至最接近的 15 秒倍數。舉例來說,假設您有三項各含 7 秒音訊內容的要求,系統便會向您收取 45 秒 (3 × 15 秒) 的費用,總共 $0.018 美元。在計算秒數時,如果您的音訊長度含有小數秒數,我們也會將其進位至最接近的 15 秒倍數。也就是說,系統會將 15.14 秒計為 30 秒,並向您收取 30 秒的費用。

另外請注意,本項服務每個月的用量上限為 100 萬分鐘。如果您每個月處理的音訊長度超過 100 萬分鐘,我們會進一步瞭解情況,並盡可能滿足您的需求。如有需要,您可以為專案提交 Speech-to-Text 配額要求表單。

Google Cloud Platform 費用

如果您將需要辨識的音訊檔案儲存在 Google Cloud Storage 中,或是在使用 Speech-to-Text 時一併使用了其他 Google Cloud Platform 資源 (例如 Google App Engine 執行個體),就必須依據相關服務的使用情況支付額外費用。您可以使用 Google Cloud Platform Pricing Calculator,根據現行費率試算其他費用。