最新模型簡介

Speech-to-Text API 中的「最新」模型標記可提供兩個新模型標記的存取權,可在您指定模型欄位時使用。這些模型的設計目的,是讓您存取 Google 最新的語音技術和機器學習研究,並可提供比其他可用模型更準確的語音辨識功能。不過,部分可用型號支援的功能,目前「最新」型號尚未支援。

最新模型以 Google 的 Conformer Speech Model 技術為基礎。如需更多資訊,請參閱 Google 研究出版品

如要使用最新模型,您必須大致瞭解如何使用 Speech-to-Text API 或 UI。如果是首次使用,請參閱快速入門

型號 ID

最新型號有兩種版本:

  • latest_short 模型適用於長度為幾秒的短語。這類指令可用於嘗試擷取指令或其他單次指向語音用途。建議您改用 latest_short,而非 command_and_search 模型。

  • latest_long 模型適用於任何長篇內容,例如媒體或即興演說和對話。建議您使用 latest_long 取代 video,特別是如果 video 在目標語言中不可用時。您也可以使用 latest_long 取代 default 模型。

模型技術

最新模型的目標,是讓 Google Cloud 使用者直接享有最新的語音技術。目前最新的模型是根據 Google 的 Conformer Speech Model 技術建構,但這項技術日後可能會有所變更。如需瞭解詳情,請參閱 Google 研究出版品清單。

定價

latest_longlatest_short 型錄會以「標準」計費,且使用量和費用與 command_and_searchdefault 型錄相同。詳情請參閱「定價」。

模型更新

最新模型採用快速進步的機器學習技術。因此,我們可能會比其他模型更頻繁地更新或重新整理模型。這些更新可新增其他功能,或稍微調整準確度或延遲時間。

語言

最新模型支援超過 20 種語言和 50 種變體。 我們會持續新增語言,請參閱「語言」頁面查看最新清單。

功能支援和限制

支援的功能因語言而異。如需支援功能的完整清單,請參閱「語言」。

最新型號目前不支援下列功能:

  • 可信度分數:API 會傳回值,但這並非真正的可信度分數。

服務水準協議範本

最新模型屬於 Speech-to-Text API 的一般可用部分。因此,這些 API 支援的功能可在 v1 API 中使用,並可享有一般可用產品和功能的相同服務水準協議和其他保護措施。