從傳統模型遷移至符合者模型

為提升轉錄和語音辨識的準確度和效能,Cloud Speech-to-Text V1 API 會將剩餘的經典語音模型更新為先進的以轉換器為基礎模型,且不會影響 API 功能。經典模型是指在 V1 API 中以 command_and_searchdefaultphone_callvideo 模型標記公開的模型。這些模型以獨立的音訊和語言模型為基礎,並支援特定的 Speech-to-Text API 用途。

自 2020 年 Google Brain 推出 Conformer 架構以來,我們已測試解決方案,並逐步取代 Speech-to-Text V1 API 模型。這項做法在多種用途中,提高了領域內的準確度、穩健性和效能。本頁面提供的操作說明,可協助您瞭解如何從遷移作業中獲益,以及如何視需求提前或延後啟用遷移作業。

異動內容

遷移期限過後,我們會開始將流量從目前公開的模型中移除。由於重新導向是在內部進行,因此這些型號 ID 仍會有效,並繼續放送流量。

這份表格顯示遷移生效時的路由。重新導向會發生在已顯示的模型 ID 之間。雖然這不是必要步驟,但您可以自行變更程式碼,並測試模型的行為。

BCP-47 代碼 現有模型 ID single_utterance 模型 ID 流量會導向
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE、en-AU、en-GB、en-IN、es-ES、es-US、fr-CA、fr-FR、it-IT、ja-JP、nl-NL、pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

時間軸

您有三種遷移選項,詳情請見本頁。自 2024 年 1 月起,我們會逐漸將流量從傳統模式轉移至以 Conformer 為基礎的模式,並在遷移前個別通知相關人員。我們預計在 2024 年 6 月前,將所有流量都轉移至符合規範的模型。任何仍要求經典模型的使用者,都會自動重新導向至相應的 Conformer 型別。

遷移機制

客戶可以按照下列操作說明,提早啟用或停用這項功能,並在日後進行遷移:

建議做法:提早選擇採用並遷移

如果您想主動加入,請將 Speech-to-Text V1 API 中使用的模型 ID 改為更新後的 ID,如上表所示。主動遷移專案可讓您有時間測試模型,並提早利用更準確且穩定的模型。

選擇不採用,稍後再進行遷移

如果您發現更新後的模型有任何問題,且想要暫時停用遷移功能,請建立支援案件 Google Cloud 。建立支援案件時,請使用「選擇不採用語音轉文字轉換器遷移功能」做為標題,並提供專案 ID 和選擇不採用的原因。