English
Deutsch
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

聯絡我們免費試用

本頁面由 Cloud Translation API 翻譯而成。

選擇轉錄函式

本文件比較了 BigQuery ML 提供的轉錄函式，分別是 ML.GENERATE_TEXT 和 ML.TRANSCRIBE。

您可以參考本文件中的資訊，在函式功能重疊時決定要使用哪個函式。

這些函式的差異如下：

ML.GENERATE_TEXT 是轉錄 10 分鐘或更短音訊片段的理想選擇，您也可以使用它執行自然語言處理 (NLP) 工作。使用 gemini-1.5-flash 模型時，使用 ML.GENERATE_TEXT 進行音訊轉錄的費用會比使用 ML.TRANSCRIBE 便宜。
ML.TRANSCRIBE 是處理超過 10 分鐘的音訊片段轉錄作業的理想選擇。並支援比 ML.GENERATE_TEXT 更廣泛的語言。

支援的模型

支援的型號如下：

ML.GENERATE_TEXT：您可以使用 Vertex AI Gemini 模型的子集生成文字。如要進一步瞭解支援的模型，請參閱 ML.GENERATE_TEXT 語法。
ML.TRANSCRIBE：您使用 Speech-to-Text API 的預設模型。使用 Document AI API 可讓您使用 Chirp 語音模型進行轉錄。

支援的工作

支援的任務如下：

ML.GENERATE_TEXT：您可以執行音訊轉錄和自然語言處理 (NLP) 工作。
ML.TRANSCRIBE：你可以進行語音轉錄。

定價

定價如下：

ML.GENERATE_TEXT：如要瞭解您搭配此函式使用的 Vertex AI 模型定價，請參閱 Vertex AI 定價。針對支援的模型進行受控調整時，系統會以每小時每節點美元計費。詳情請參閱「Vertex AI 自訂訓練定價」。
ML.TRANSCRIBE：如要瞭解與此函式搭配使用的 Cloud AI 服務定價，請參閱Speech-to-Text API 定價。

監督式調整

監督式調整支援功能如下：

ML.GENERATE_TEXT：部分模型支援監督式調整。
ML.TRANSCRIBE：不支援監督式調整。

每分鐘查詢次數 (QPM) 上限

QPM 限制如下：

ML.GENERATE_TEXT：gemini-1.5-pro 模型的預設 us-central1 區域為 60 QPM，gemini-1.5-flash 模型的預設 us-central1 區域為 200 QPM。詳情請參閱「Vertex AI 生成式 AI 配額」。
ML.TRANSCRIBE：每個專案每分鐘 900 次查詢。詳情請參閱「配額與限制」。

如要提高配額，請參閱「要求調整配額」一文。

詞元數量上限

符記限制如下：

ML.GENERATE_TEXT：700 個輸入符記和 8196 個輸出符記。這項輸出符記限制表示 ML.GENERATE_TEXT 針對個別音訊片段的限制為約 39 分鐘。
ML.TRANSCRIBE：沒有符記限制。不過，這項功能的個別音訊片段長度上限為 480 分鐘。

支援的語言

支援的語言如下：

ML.GENERATE_TEXT：支援與 Gemini 相同的語言。
ML.TRANSCRIBE：支援所有語音轉文字支援語言。

適用地區

適用地區如下：

ML.GENERATE_TEXT：適用於所有 Vertex AI 生成式 AI 區域。
ML.TRANSCRIBE：適用於 EU 和 US 多地區的所有語音辨識器。

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2025-09-04 (世界標準時間)。