English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

联系我们免费开始使用吧

单独一条话语行为

Speech-to-Text 提供 latest_short 模型，用于识别由单独一条话语构成的语音。如果您的应用需要用户发出单一语音指令（而不是长篇独白或口录），那么该模型会非常有用。

当使用设置了 latest_short 模型的识别器来发出识别请求时，Speech-to-Text 会在检测到一条话语完成后停止执行识别。Speech-to-Text 将返回 END_OF_SINGLE_UTTERANCE 类型的语音活动事件响应，并显示转录结果。

单独一条话语和 StreamingRecognize

如果为 StreamingRecognize 请求选择了 latest_short 模型 Recognizer，Speech-to-Text 会在话语结束后自动关闭数据流。

包含语音活动事件

如果还为 StreamingRecognize 请求启用了语音活动事件，那么 Speech-to-Text 还会返回语音开始/结束语音活动事件。针对语音开始事件的语音活动超时也将适用；但针对语音结束事件的语音活动超时不适用，因为系统会在话语结束时立即关闭数据流。

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2025-07-24。