本页介绍了如何在 Speech-to-Text 的转录结果中获取自动加注标点符号功能。启用此功能后,Speech-to-Text 会自动推断出您的音频数据中出现的句号、逗号和问号,并将它们添加到转录文本中。
默认情况下,Speech-to-Text 不在语音识别结果中添加标点符号。不过,您可以要求 Speech-to-Text 在转录结果中自动检测和插入标点符号。启用自动加注标点符号功能后,Speech-to-Text 还会自动将每个句号和问号后的第一个字母大写。
如需启用自动加注标点符号功能,请将请求的 RecognitionConfig 参数的 enableAutomaticPunctuation 字段设置为 true。Speech-to-Text API 的自动加注标点符号功能支持以下所有语音识别方法:speech:recognize、speech:longrunningrecognize 和流式。
以下代码示例演示了如何在转录请求中获取自动加注标点符号详细信息。
协议
如需了解完整的详细信息,请参阅speech:recognize API 端点。
如需执行同步语音识别,请发出 POST 请求并提供相应的请求正文。以下示例展示了一个使用 curl 发出的 POST 请求。该示例使用 Google Cloud CLI 生成访问令牌。如需了解如何安装 gcloud CLI,请参阅快速入门。
curl -s -H "Content-Type: application/json" \
-H "Authorization: Bearer "$(gcloud auth print-access-token) \
https://speech.googleapis.com/v1/speech:recognize \
--data '{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 16000,
"languageCode": "en-US",
"enableAutomaticPunctuation": true
},
"audio": {
"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
}
}'
如需详细了解如何配置请求正文,请参阅 RecognitionConfig 参考文档。
如果请求成功,服务器将返回一个 200 OK HTTP 状态代码以及 JSON 格式的响应:
{
"results": [
{
"alternatives": [
{
"transcript": "How old is the Brooklyn Bridge?",
"confidence": 0.98360395
}
]
}
]
}
Go
如需了解如何安装和使用 Speech-to-Text 客户端库,请参阅 Speech-to-Text 客户端库。 如需了解详情,请参阅 Speech-to-Text Go API 参考文档。
如需向 Speech-to-Text 进行身份验证,请设置应用默认凭证。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解如何安装和使用 Speech-to-Text 客户端库,请参阅 Speech-to-Text 客户端库。 如需了解详情,请参阅 Speech-to-Text Java API 参考文档。
如需向 Speech-to-Text 进行身份验证,请设置应用默认凭证。 如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js
如需了解如何安装和使用 Speech-to-Text 客户端库,请参阅 Speech-to-Text 客户端库。 如需了解详情,请参阅 Speech-to-Text Node.js API 参考文档。
如需向 Speech-to-Text 进行身份验证,请设置应用默认凭证。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解如何安装和使用 Speech-to-Text 客户端库,请参阅 Speech-to-Text 客户端库。 如需了解详情,请参阅 Speech-to-Text Python API 参考文档。
如需向 Speech-to-Text 进行身份验证,请设置应用默认凭证。 如需了解详情,请参阅为本地开发环境设置身份验证。
其他语言
C#:请按照客户端库页面上的 C# 设置说明操作,然后访问 .NET 版 Speech-to-Text 参考文档。
PHP:请按照客户端库页面上的 PHP 设置说明操作,然后访问 PHP 版 Speech-to-Text 参考文档。
Ruby:请按照客户端库页面上的 Ruby 设置说明操作,然后访问 Ruby 版 Speech-to-Text 参考文档。
后续步骤
查看如何发出同步转录请求。