从传统模型迁移到 Conformer 模型

为了提高转写和语音识别的准确率和性能,Cloud Speech-to-Text V1 API 正在将其余的传统语音模型更新为先进的基于 Conformer 的模型,而不会破坏 API 功能。传统模型是指 V1 API 中在 command_and_searchdefaultphone_callvideo 模型标志下公开的模型。它们基于独立的声学和语言模型,并一直支持选定的 Speech-to-Text API 应用场景。

自 2020 年 Google Brain 推出 Conformer 架构以来,我们测试了解决方案,并逐步取代了 Speech-to-Text V1 API 模型。这样做可以提高在一系列应用场景中的领域内准确性、稳健性和性能。在本页面中,您可以找到有关如何从迁移获益的说明,以及如何根据需要选择尽早迁移或稍后迁移。

有何变化

在迁移截止期限之后,我们会开始将流量从当前公开的模型中迁出。这些模型标识符将保持有效并继续传送流量,因为重定向是在内部进行的。

下表显示了迁移生效时发生的路由。重定向将在已可见的模型标识符之间进行。虽然不是必需的,但是您可以自行更改代码并测试模型行为。

BCP-47 代码 当前模型标识符 single_utterance 定向到的模型标识符流量
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE、en-AU、en-GB、en-IN、es-ES、es-US、fr-CA、fr-FR、it-IT、ja-JP、nl-NL、pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

时间表

本页面概述了三个迁移选项。2024 年 1 月,我们将开始逐步按项目将流量从传统模型迁移到基于 Conformer 的模型,并且会在迁移前逐一进行沟通。在 2024 年 6 月之前,我们预计会将所有流量都迁移到 Conformer 模型。任何请求传统模型的用户都会自动重新路由到基于 Conformer 的相应模型。

迁移机制

客户可以按照以下说明选择启用并尽早迁移,也可以选择停用并稍后迁移:

首选:选择启用并尽早迁移

如果您想要主动选择启用,请将您在 Speech-to-Text V1 API 中一直使用的模型标识符更改为更新后的模型标识符,如上表中所示。主动迁移项目让您能够测试模型并利用之前提高的准确率和稳健性。

自动迁移

您无需执行任何操作即可自动迁移。现有的 Speech-to-Text V1 API 模型标识符有效,我们会在内部迁移流量。在项目迁移后,您将收到来自我们的团队的信息。

如需检查项目的迁移状态,请执行以下操作:

  1. 前往 Google Cloud Speech 控制台

  2. 前往左侧导航栏中的“预览版功能”部分。

  3. 检查表中模型的状态。

选择停用并稍后迁移

如果您发现更新后的模型出现任何问题,并希望暂时退出迁移,请创建 Google Cloud 支持请求。创建支持请求时,请使用标题“选择退出 Speech-to-Text Conformer 迁移”,并提供项目 ID 和选择退出的原因。