选择转写函数
本文档对 BigQuery ML 中提供的转写函数进行了比较,这些函数分别为 ML.GENERATE_TEXT
和 ML.TRANSCRIBE
。
在函数功能重叠的情况下,您可以使用本文档中的信息来帮助您确定要使用哪个函数。
概括来说,这些函数之间的区别如下:
ML.GENERATE_TEXT
非常适合用于转写时长不超过 10 分钟的音频片段,您还可以使用它执行自然语言处理 (NLP) 任务。使用gemini-1.5-flash
模型时,通过ML.GENERATE_TEXT
进行音频转写的费用低于通过ML.TRANSCRIBE
进行转写的费用。如需对时长超过 10 分钟的音频片段执行转写,
ML.TRANSCRIBE
是一个不错的选择。它还支持比ML.GENERATE_TEXT
更广泛的语言。
支持的模型
支持的型号如下:
ML.GENERATE_TEXT
:您可以使用 Vertex AI Gemini 模型的一部分来生成文本。如需详细了解支持的模型,请参阅ML.GENERATE_TEXT
语法。ML.TRANSCRIBE
:您使用 Speech-to-Text API 的默认模型。使用 Document AI API 可让您使用 Chirp 语音模型进行转写。
支持的任务
支持的任务如下:
ML.GENERATE_TEXT
:您可以执行音频转写和自然语言处理 (NLP) 任务。ML.TRANSCRIBE
:您可以执行音频转写。
价格
价格如下所示:
ML.GENERATE_TEXT
:如需了解与此函数搭配使用的 Vertex AI 模型的价格,请参阅 Vertex AI 价格。对受支持模型的监督式调优按每节点时美元收费。如需了解详情,请参阅 Vertex AI 自定义训练价格。ML.TRANSCRIBE
:如需了解与此函数搭配使用的 Cloud AI 服务的价格,请参阅 Speech-to-Text API 价格。
监督式调优
监督式调整支持如下:
ML.GENERATE_TEXT
:某些模型支持监督式调优。ML.TRANSCRIBE
:不支持监督式调优。
每分钟查询次数 (QPM) 限额
QPM 限制如下:
ML.GENERATE_TEXT
:对于gemini-1.5-pro
模型,在默认的us-central1
区域为 60 QPM;对于gemini-1.5-flash
模型,在默认的us-central1
区域为 200 QPM。如需了解详情,请参阅 Vertex AI 上的生成式 AI 配额。ML.TRANSCRIBE
:每个项目 900 QPM。如需了解详情,请参阅配额和限制。
如需增加配额,请参阅申请更高配额。
token 限制
令牌限制如下:
ML.GENERATE_TEXT
:700 个输入令牌和 8196 个输出令牌。此输出令牌限制意味着,ML.GENERATE_TEXT
的单个音频片段的限制时间约为 39 分钟。ML.TRANSCRIBE
:没有令牌限制。不过,此函数对单个音频片段的限制为 480 分钟。
支持的语言
支持的语言如下:
ML.GENERATE_TEXT
:支持与 Gemini 相同的语言。ML.TRANSCRIBE
:支持所有 Speech-to-Text 支持的语言。
区域可用性
推出区域如下: