配额和限制

使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

本文介绍 Cloud Speech-to-Text 的当前 API 限制和用量限额。如果这些限制和用量限额发生任何更改,我们会相应地更新本页面以反映这些更改。我们保留更改这些限制的权利。

如有必要,您可以申请增加配额。如需详细了解如何查看和管理您的配额,请参阅 Cloud 的“配额”页面

在您提交申请后,Google 可能会联系您获取更多信息,并告知您的申请是否获批。

内容限制

提供给 Speech-to-Text 的内容采用音频数据的形式,可在请求的 content 字段中直接指定,也可在请求的 uri 字段中以 Google Cloud Storage URI 的形式引用。使用本地文件发送至 API 的所有单个请求的大小不能超过 10 MB。对于 RecognizeLongRunningRecognize 方法,此限制适用于发送的请求大小。对于 StreamingRecognize 方法,10 MB 的限制适用于初始 StreamingRecognize 请求和数据流中每一条消息的大小。超出此限制时,系统会抛出错误。使用存储在 Google Cloud Storage 存储分区中的音频数据发送的请求不受大小限制。

该 API 对此类内容的大小有以下限制(可能会更改)。

内容限制 音频时长
同步请求 约 1 分钟
异步请求 约 480 分钟*
流式请求 约 5 分钟**

* 如果音频时长超过约 1 分钟,则必须使用 uri 字段来引用 Google Cloud Storage 中的音频文件。
** 如果您需要流式传输超过 5 分钟的内容,请参阅无限流式传输教程

对于 StreamingRecognize 请求,必须以接近实时的速率发送音频。

如果内容超出这些限制,系统会在尝试处理内容时产生错误。 如需了解详情,请参阅错误消息问题排查

您还可以在任何请求中提供一个 PhraseSet 资源,内含特定于该请求的短语列表。(此情况下单个字词也被视为一个短语)。以下限制适用于此类情况:

语音自适应限制
每个请求的短语数 5000
每个请求的总字符数 10 万
每个短语的字符数 100

请求限制

Speech-to-Text 的当前 API 用量限额如下(可能会更改):

限制类型 用量限额
每 60 秒的识别请求数* 900
每 60 秒的自适应资源请求数* 10
每天处理量 480 小时音频

* 每个 StreamingRecognize 会话都被视为单个请求,即使该流中包含多帧 StreamingRecognizeRequest 音频也是如此。

当请求和/或尝试处理超出这些限制的音频时,系统将会产生错误。 如需了解详情,请参阅错误消息问题排查

这些限制适用于每个 Speech-to-Text 开发者项目,并且使用给定开发者项目的所有应用和 IP 地址消耗的用量均计入该限额。