从 Speech-to-Text v1 迁移到 v2
bookmark_borderbookmark
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
Speech-to-Text API v2 采用最新的 Google Cloud API 设计,能够直接用于满足客户的企业安全和监管要求。
这些要求通过以下功能实现:
数据驻留:Speech-to-Text v2 在 Google Cloud 区域(例如比利时或新加坡)中提供丰富的现有转写模型。您可以通过完全区域化的服务调用我们的转写模型。
识别器资源性:识别器是可重复使用的识别配置,可以包含模型、语言和功能的组合。使用这一资源性实现时,您无需使用专用服务账号进行身份验证和授权。
日志记录:资源创建和转写会生成可在 Google Cloud 控制台中查看的日志,帮助您更好地进行遥测和调试。
加密:Speech-to-Text v2 支持为所有资源以及批量转写使用客户管理的加密密钥。
音频自动检测:Speech-to-Text v2 可以自动检测音频文件的采样率、通道数和格式,您无需在请求配置中提供该信息。
从 v1 迁移到 v2
从 v1 API 到 v2 API 的迁移不是自动进行的。您只需进行少量实现更改即可利用此功能集。
在 API 中迁移
与 Speech-to-Text v1 类似,如需转写音频,您需要通过选择音频语言和识别模型来创建 RecognitionConfig
:
(可选)如果您需要在多个转写请求中重复使用特定的识别配置,请创建识别器资源:
新的 v2 API 在请求和响应方面还有其他差异。如需了解详情,请参阅参考文档。
在界面中迁移
如需通过语言 Google Cloud 控制台迁移,请按以下步骤操作:
进入语音 Google Cloud 控制台。
打开转写页面。
点击新建转写,然后在音频配置标签页中选择音频。
在转写选项标签页中,选择 V2。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-03-06。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-03-06。"],[],[]]