增强型语音自适应是可选的语音自适应功能。 使用增强型,您可以根据音频数据中字词和/或短语的识别频率,向其添加数值权重。
在以下情况下,我们建议您实现增强型功能:1) 已实现语音自适应;2) 您希望调整语音自适应对转录结果的影响强度。
如需了解语音自适应和语音自适应增强型最佳做法,请参阅语音自适应概念页面。
以下代码示例演示了如何使用增强型语音自适应发送请求。
REST
如需详细了解 API 端点,请参阅 speech:recognize
。
在使用任何请求数据之前,请先进行以下替换:
- language-code:音频剪辑中所用语言的 BCP-47 代码。
- phrases-to-boost:您希望 Speech-to-Text 增强的短语或短语组(以一组字符串的形式提供)。
- storage-bucket:Cloud Storage 存储分区;
- input-audio:您要转录的音频数据。
HTTP 方法和网址:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
请求 JSON 正文:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
Java
Node.js
Python