自动检测语言

使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

本页面介绍如何设置识别器,以便自动根据可能的语言列表识别音频文件中所用的语言。

有些时候,您并不确定音频录音中会包含哪些语言。例如,如果您在具有多种官方语言的国家/地区发布服务、应用或产品,则可能会接收用户以多种语言提供的音频输入。这种情况下,为转录的音频文本请求指定单独一种语言代码的难度很大。

多语言识别

Speech-to-Text 为您提供了一种方法,让您可以指定音频数据可能包含的一组语言。创建 Recognizer 时,您可以在 languageCodes 字段中提供音频数据可能包含的一种或多种语言。然后,当您在转录音频成文本的请求中使用 Recognizer 时,Speech-to-Text 会尝试使用您提供的备选语言列表中最合适的语言来转录音频。随后,Speech-to-Text 会使用预测的语言代码标记转录结果。

此功能非常适合需要转录语音指令或搜索等简短语句的应用。您最多可以列出四种语言以进行自动语言识别。

在音频转录请求中启用语言识别

Recognizer 资源中指定多种语言与指定单一语言的工作原理完全相同:只需将新语言代码添加到 languageCodes 字段即可。Speech-to-Text 的备用语言代码支持以下所有语音识别方法:RecognizeStreamingRecognize