本頁面由 Cloud Translation API 翻譯而成。

Speech-to-Text 定價

Speech-to-Text 服務每月會依據服務成功處理的音訊量，以一秒為單位計費。如果 API 傳回回應，表示要求中傳送的音訊已成功處理。這包括空白回應，表示 API 已處理音訊，但無法轉錄音訊。導致伺服器錯誤的要求不會成功計為處理，因此不會產生任何費用。

您可以在 Google Cloud 控制台中查看目前的帳單狀態，包括用量和當期帳單。如要進一步瞭解如何管理帳戶，請參閱 Cloud Billing 說明文件或帳單與付款支援相關說明。

價目表

下表所列價格適用於 Speech-to-Text V1 API 每月處理的音訊分鐘數。

類別	模型	定價
類別	模型	每月 0-60 分鐘	超過 60 分鐘/月
語音辨識 (不記錄資料 - 預設)	標準 1	免費	每分鐘 $0.024 美元 **
語音辨識 (不記錄資料 - 預設)	醫療 2	免費	每分鐘 $0.078 美元 **
語音辨識 (已啟用資料記錄功能)	標準 1	免費	每分鐘 $0.016 美元 **

下表所列價格適用於 Speech-to-Text V2 API 每月處理的音訊分鐘數。

類別	模型	定價
類別	模型	每月 0-500,000 分鐘	每月 500,000 至 1,000,000 分鐘	每月 1,000,000 至 2,000,000 分鐘	每月超過 2,000,000 分鐘
語音辨識 (預設)	標準 1	每分鐘 $0.016 美元 **	每分鐘 $0.010 美元 **	每分鐘 $0.008 美元 **	每分鐘 $0.004 美元 **
語音辨識 (預設)	醫療 2	每分鐘 $0.078 美元 **	每分鐘 $0.078 美元 **	每分鐘 $0.078 美元 **	每分鐘 $0.078 美元 **
動態批次語音辨識	標準 1	每分鐘 $0.003 美元 **	每分鐘 $0.003 美元 **	每分鐘 $0.003 美元 **	每分鐘 $0.003 美元 **

Standard1 模型包括：default、command_and_search、latest_short、latest_long、phone_call、video、chirp (僅限 Speech-to-Text V2)。
Medical2 型號：medical_conversation、medical_dictation。

** 每項要求的執行時間均會進位至最接近的 1 秒倍數。

定價要素

Speech-to-Text 所適用的費率取決於下列要素：

* 待辨識音訊的聲道數。 * 傳送的音訊長度和時間長度。 * 使用的辨識模型。 * 您使用的批次方法。 * 您使用的 API 版本。

多個聲道

不同的音訊聲道會分開計費。如果您傳送的要求中包含多個聲道，系統將依照所有聲道中經處理的音訊總長度向您收費。這種依時間計費的方式與追蹤每月用量限制的方式不同。用量限制僅會計入音訊檔案的時間長度，不受聲道數量影響。舉例來說，如果您傳送的要求中包含 30 秒的音訊和 4 個聲道，系統會向您收取 120 秒的費用，但只有 30 秒會計入您的每月配額。詳情請參閱配額與限制頁面。

動態批次

Speech-to-Text V2 API 可讓您選擇使用動態批次。動態批次處理音訊的緊急程度較低。如果啟用動態批次，將會以折扣費率計費。

大型工作負載

針對工作負載非常大的客戶，或許可以享有額外的用量折扣。如要瞭解詳情，請與銷售人員聯絡。

Google Cloud Platform 費用

如果您將要辨識的音訊檔案儲存在 Google Cloud Storage 中，或是在使用 Speech-to-Text 時一併使用了其他 Google Cloud Platform 資源 (例如 Google App Engine 執行個體)，就必須依據相關服務的使用情況支付額外費用。您可以使用 Google Cloud Platform Pricing Calculator，根據現行費率試算其他費用。

後續步驟

索取客製化報價

Google Cloud 採「即付即用」的定價方式，因此您只需要為實際使用的服務付費。貴機構如需索取客製化的報價，請與我們的銷售團隊聯絡。

聯絡銷售人員