本頁面由 Cloud Translation API 翻譯而成。

最新模型簡介

Speech-to-Text API 中的「最新」模型標記提供兩個新模型標記的存取權，您可以在指定模型欄位時使用這些標記。這些模型可讓您存取 Google 的最新語音技術和機器學習研究成果，與其他可用模型相比，語音辨識準確度更高。不過，其他可用模型支援的部分功能，「最新」模型目前尚不支援。

最新模型採用 Google 的 Conformer 語音模型技術，如要瞭解詳情，請參閱 Google 研究出版品。

如要使用最新模型，您必須大致瞭解如何使用 Speech-to-Text API 或使用者介面。如果是第一次使用，請參閱快速入門導覽課程。

最新機型有兩種不同版本：

latest_short 模型適用於長度幾秒的簡短語音。這項功能適合用於擷取指令或其他單次定向語音用途。建議使用 latest_short，而非 command_and_search 模型。
latest_long 模型適用於任何形式的長篇內容，例如媒體、即時語音和對話。建議使用 latest_long 取代 video，特別是目標語言不支援 video 時。您也可以使用 latest_long 取代 default 模型。

最新模型旨在直接為 Google Cloud 使用者提供最新的語音技術。我們目前的最新模型是以 Google 的 Conformer 語音模型技術為基礎，但未來可能會有所變更。如要瞭解詳情，請參閱 Google 研究出版品清單。

latest_long 和 latest_short 模型會以「標準」計費，且與 command_and_search 或 default 模型適用相同的使用量和費用。詳情請參閱「定價」。

最新模型採用快速進步的機器學習技術，因此，我們可能會比其他模型更頻繁地更新或重新整理模型。這些更新可能會新增其他功能，或稍微變更準確度或延遲時間。

最新模型支援超過 20 種語言和 50 種以上的變體。我們會持續新增語言，如需最新清單，請參閱「語言」一文。

支援的功能因語言而異。如需支援功能的完整清單，請參閱「語言」一文。

最新機型目前不支援下列功能：

最新模型屬於 Speech-to-Text API 的正式發布部分。因此，這些功能支援的作業可透過 v1 API 執行，並享有與正式發布產品和功能相同的服務水準協議和其他保護措施。