為提升轉錄和語音辨識的準確度和效能,Cloud Speech-to-Text V1 API 會將剩餘的經典語音模型更新為先進的以轉換器為基礎模型,且不會影響 API 功能。經典模型是指在 V1 API 中以 command_and_search
、default
、phone_call
和 video
模型標記公開的模型。這些模型以獨立的音訊和語言模型為基礎,並支援特定的 Speech-to-Text API 用途。
自 2020 年 Google Brain 推出 Conformer 架構以來,我們已測試解決方案,並逐步取代 Speech-to-Text V1 API 模型。這項做法在多種用途中,提高了領域內的準確度、穩健性和效能。本頁面提供的操作說明,可協助您瞭解如何從遷移作業中獲益,以及如何視需求提前或延後啟用遷移作業。
異動內容
遷移期限過後,我們會開始將流量從目前公開的模型中移除。由於重新導向是在內部進行,因此這些型號 ID 仍會有效,並繼續放送流量。
這份表格顯示遷移生效時的路由。重新導向會發生在已顯示的模型 ID 之間。雖然這不是必要步驟,但您可以自行變更程式碼,並測試模型的行為。
BCP-47 代碼 | 現有模型 ID | single_utterance | 模型 ID 流量會導向 |
---|---|---|---|
en-US | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
telephony |
|
phone_call |
false |
telephony |
|
phone_call(use_enhanced=true) |
true |
telephony_short |
|
video |
false |
telephony |
|
de-DE、en-AU、en-GB、en-IN、es-ES、es-US、fr-CA、fr-FR、it-IT、ja-JP、nl-NL、pt-BR | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
latest_long |
|
phone_call(use_enhanced=true) |
true |
latest_short |
|
phone_call |
false |
latest_long |
時間軸
您有三種遷移選項,詳情請見本頁。自 2024 年 1 月起,我們會逐漸將流量從傳統模式轉移至以 Conformer 為基礎的模式,並在遷移前個別通知相關人員。我們預計在 2024 年 6 月前,將所有流量都轉移至符合規範的模型。任何仍要求經典模型的使用者,都會自動重新導向至相應的 Conformer 型別。
遷移機制
客戶可以按照下列操作說明,提早啟用或停用這項功能,並在日後進行遷移:
建議做法:提早選擇採用並遷移
如果您想主動加入,請將 Speech-to-Text V1 API 中使用的模型 ID 改為更新後的 ID,如上表所示。主動遷移專案可讓您有時間測試模型,並提早利用更準確且穩定的模型。
選擇不採用,稍後再進行遷移
如果您發現更新後的模型有任何問題,且想要暫時停用遷移功能,請建立支援案件 Google Cloud 。建立支援案件時,請使用「選擇不採用語音轉文字轉換器遷移功能」做為標題,並提供專案 ID 和選擇不採用的原因。