-
启用字词级置信度
指定 Cloud Speech-to-Text 为转录中每个字词指示准确度(置信度)值。
-
区分不同的讲话人
在 Cloud Speech-to-Text 转录的音频数据中为不同的讲话人添加标签。
-
自动检测语言
为发送到 Cloud Speech-to-Text 的音频转录请求提供多种语言代码。
-
转录多通道音频
转录包含多个通道的音频文件。
-
选择转录模型
选择专用的机器学习模型来进行音频转录。
-
启用数据日志记录
在您的 Google Cloud 项目上启用数据日志记录,以享受折扣价格。
-
使用增强型模型
使用增强型语音识别模型。
-
添加识别元数据
提供关于包含在转录请求中的音频的更多详细信息,以获得质量更高的输出。
-
获取标点符号
在 Speech-to-Text 的转录结果中添加标点符号。
-
添加字词时间戳
对远程文件执行语音识别,并为识别出的字词添加时间偏移(时间戳)值。
Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.