配額與限制

本文說明現行的 Cloud Speech-to-Text API 限制和用量上限。這些限制和用量上限如有變更,我們也會同步更新本頁面的資訊。Google 保留更改這些限制的權利。

如有需要,您也可以申請提高配額。要進一步瞭解如何查看及管理配額,請參閱 Cloud 配額頁面

在提出申請後,Google 可能會與您聯絡以進一步瞭解相關資訊,並且會通知您是否核准要求。

內容限制

Speech-to-Text 接受以音訊資料形式提供的內容,您可以直接在要求的 content 欄位中提供音訊檔案,或是以要求的 uri 欄位指定要參照的 Google Cloud Storage URI。使用本機檔案傳送至 API 的各項要求上限均為 10 MB。如為 RecognizeLongRunningRecognize 方法,這項限制適用於傳送的要求大小。如為 StreamingRecognize 方法,則 10 MB 的限制適用於初始 StreamingRecognize 要求和串流中每則訊息的大小。如果超出這項限制,系統就會擲回錯誤。如果您傳送的要求使用的是 Google Cloud Storage 值區中儲存的音訊資料,則沒有限制。

API 針對這類內容的大小設有下列限制 (我們可能會視情況調整這些限制)。

內容限制 音訊時間長度
同步要求 約 1 分鐘
非同步要求 約 480 分鐘*
串流要求 約 5 分鐘**

* 如果音訊的時間長度超過 1 分鐘,則必須使用 uri 欄位來參照 Google Cloud Storage 中的音訊檔案。
** 如果您需要串流超過 5 分鐘的內容,請參閱無限串流教學課程

如為 StreamingRecognize 要求,音訊必須以近乎即時的速率傳送。

如果嘗試處理超過這些內容限制的內容,就會產生錯誤。

您也可以在任何要求中提供 SpeechContext 資源,並在其中包含該要求專用的詞組清單 (在這種情況下,系統會將一個字詞視為一個詞組)。這類情況適用下列限制:

SpeechContext 限制
每次要求的詞組數 5000 個
每次要求的字元總數 100,000 個
每個詞組的字元數 100 個

要求限制

Speech-to-Text 目前的 API 用量限制如下 (未來可能異動):

限制類型 用量限制
每 60 秒要求數* 900 次
每日處理量 480 小時的音訊

* 系統會將每個 StreamingRecognize 工作階段視為一個要求,即使串流包含 StreamingRecognizeRequest 音訊的多個音框也是如此。

如果要求和/或嘗試處理的音訊超出這些限制,就會產生錯誤。

這些限制適用於每項 Speech-to-Text 開發人員專案,而且使用該開發人員專案的所有應用程式和 IP 位址必須共用上述額度。