Speech-to-Text 定價

Speech-to-Text 服務每月會依據服務成功處理的音訊量,以一秒為單位計費。如果 API 傳回回應,表示要求中傳送的音訊已成功處理。這包括空白回應,表示 API 已處理音訊,但無法轉錄音訊。導致伺服器錯誤的要求不會成功計為處理,因此不會產生任何費用。

您可以在 Google Cloud 控制台中查看目前的帳單狀態,包括用量和當期帳單。如要進一步瞭解如何管理帳戶,請參閱 Cloud Billing 說明文件帳單與付款支援相關說明。

價目表

下表所列價格適用於 Speech-to-Text V1 API 每月處理的音訊分鐘數。

類別 模型 定價
每月 0-60 分鐘 超過 60 分鐘/月
語音辨識 (不記錄資料 - 預設) 標準 1 免費 每分鐘 $0.024 美元 **
醫療 2 免費 每分鐘 $0.078 美元 **
語音辨識 (已啟用資料記錄功能) 標準 1 免費 每分鐘 $0.016 美元 **

下表所列價格適用於 Speech-to-Text V2 API 每月處理的音訊分鐘數。

類別 模型 定價
每月 0-500,000 分鐘 每月 500,000 至 1,000,000 分鐘 每月 1,000,000 至 2,000,000 分鐘 每月超過 2,000,000 分鐘
語音辨識 (預設) 標準 1 每分鐘 $0.016 美元 ** 每分鐘 $0.010 美元 ** 每分鐘 $0.008 美元 ** 每分鐘 $0.004 美元 **
醫療 2 每分鐘 $0.078 美元 ** 每分鐘 $0.078 美元 ** 每分鐘 $0.078 美元 ** 每分鐘 $0.078 美元 **
動態批次語音辨識 標準 1 每分鐘 $0.003 美元 ** 每分鐘 $0.003 美元 ** 每分鐘 $0.003 美元 ** 每分鐘 $0.003 美元 **

Standard1 模型包括:defaultcommand_and_searchlatest_shortlatest_longphone_callvideochirp (僅限 Speech-to-Text V2)。
Medical2 型號:medical_conversationmedical_dictation

** 每項要求的執行時間均會進位至最接近的 1 秒倍數。

定價要素

Speech-to-Text 所適用的費率取決於下列要素:

* 待辨識音訊的聲道數。 * 傳送的音訊長度和時間長度。 * 使用的辨識模型。 * 您使用的批次方法。 * 您使用的 API 版本。

多個聲道

不同的音訊聲道會分開計費。如果您傳送的要求中包含多個聲道,系統將依照所有聲道中經處理的音訊總長度向您收費。這種依時間計費的方式與追蹤每月用量限制的方式不同。用量限制僅會計入音訊檔案的時間長度,不受聲道數量影響。舉例來說,如果您傳送的要求中包含 30 秒的音訊和 4 個聲道,系統會向您收取 120 秒的費用,但只有 30 秒會計入您的每月配額。詳情請參閱配額與限制頁面。

動態批次

Speech-to-Text V2 API 可讓您選擇使用動態批次。動態批次處理音訊的緊急程度較低。如果啟用動態批次,將會以折扣費率計費。

大型工作負載

針對工作負載非常大的客戶,或許可以享有額外的用量折扣。如要瞭解詳情,請與銷售人員聯絡

Google Cloud Platform 費用

如果您將要辨識的音訊檔案儲存在 Google Cloud Storage 中,或是在使用 Speech-to-Text 時一併使用了其他 Google Cloud Platform 資源 (例如 Google App Engine 執行個體),就必須依據相關服務的使用情況支付額外費用。您可以使用 Google Cloud Platform Pricing Calculator,根據現行費率試算其他費用。

後續步驟

索取客製化報價

Google Cloud 採「即付即用」的定價方式,因此您只需要為實際使用的服務付費。貴機構如需索取客製化的報價,請與我們的銷售團隊聯絡。
聯絡銷售人員