配额和限制

本文介绍 Cloud Speech-to-Text 的当前 API 限制和用量限额。如果这些限制和用量限额发生任何更改,我们会相应地更新本页面以反映这些更改。我们保留更改这些限制的权利。

如有必要,您可以申请增加配额。如需详细了解如何查看和管理您的配额,请参阅 Cloud 的“配额”页面

在您提交申请后,Google 可能会向您索要更多信息,并告知您的申请是否获批。

内容限制

提供给 Speech-to-Text 的内容采用音频数据的形式,可在请求的 content 字段中直接指定,也可在请求的 uri 字段中以 Google Cloud Storage URI 的形式引用。

该 API 对此类内容的大小有以下限制(可能会更改)。

内容限制 音频时长
同步请求 约 1 分钟
异步请求 约 480 分钟*
流式请求 约 5 分钟**

* 如果音频时长超过约 1 分钟,则必须使用 uri 字段来引用 Google Cloud Storage 中的音频文件。
**如果您需要流式传输超过 5 分钟的内容,请参阅无限流式传输教程

对于 StreamingRecognize 请求,必须以接近实时的速率发送音频。

如果内容超出这些限制,系统会在尝试处理内容时产生错误。

您还可以在任何请求中提供一个 SpeechContext 资源,内含特定于该请求的短语列表。(此情况下单个字词也被视为一个短语)。以下限制适用于此类情况:

SpeechContext 限制
每个请求的短语数 5000
每个请求的总字符数 10 万
每个短语的字符数 100

请求限制

Speech-to-Text 的当前 API 用量限额如下(可能会更改):

限制类型 用量限额
每 60 秒请求数* 900
每天处理量 480 小时音频

* 每个 StreamingRecognize 会话都被视为单个请求,即使该流中包含多帧 StreamingRecognizeRequest 音频也是如此。

当请求和/或尝试处理超出这些限制的音频时,系统将会产生错误。

这些限制适用于每个 Speech-to-Text 开发者项目,并且使用给定开发者项目的所有应用和 IP 地址消耗的用量均计入该限额。