选择转写函数

本文档对 BigQuery ML 中提供的转写函数进行了比较,这些函数分别为 ML.GENERATE_TEXTML.TRANSCRIBE

在函数功能重叠的情况下,您可以使用本文档中的信息来帮助您确定要使用哪个函数。

概括来说,这些函数之间的区别如下:

  • ML.GENERATE_TEXT 非常适合用于转写时长不超过 10 分钟的音频片段,您还可以使用它执行自然语言处理 (NLP) 任务。使用 gemini-1.5-flash 模型时,通过 ML.GENERATE_TEXT 进行音频转写的费用低于通过 ML.TRANSCRIBE 进行转写的费用。

  • 如需对时长超过 10 分钟的音频片段执行转写,ML.TRANSCRIBE 是一个不错的选择。它还支持比 ML.GENERATE_TEXT 更广泛的语言。

支持的模型

支持的型号如下:

支持的任务

支持的任务如下:

  • ML.GENERATE_TEXT:您可以执行音频转写和自然语言处理 (NLP) 任务。
  • ML.TRANSCRIBE:您可以执行音频转写。

价格

价格如下所示:

  • ML.GENERATE_TEXT:如需了解与此函数搭配使用的 Vertex AI 模型的价格,请参阅 Vertex AI 价格。对受支持模型的监督式调优按每节点时美元收费。如需了解详情,请参阅 Vertex AI 自定义训练价格
  • ML.TRANSCRIBE:如需了解与此函数搭配使用的 Cloud AI 服务的价格,请参阅 Speech-to-Text API 价格

监督式调优

监督式调整支持如下:

  • ML.GENERATE_TEXT:某些模型支持监督式调优
  • ML.TRANSCRIBE:不支持监督式调优。

每分钟查询次数 (QPM) 限额

QPM 限制如下:

  • ML.GENERATE_TEXT:对于 gemini-1.5-pro 模型,在默认的 us-central1 区域为 60 QPM;对于 gemini-1.5-flash 模型,在默认的 us-central1 区域为 200 QPM。如需了解详情,请参阅 Vertex AI 上的生成式 AI 配额
  • ML.TRANSCRIBE:每个项目 900 QPM。如需了解详情,请参阅配额和限制

如需增加配额,请参阅申请更高配额

token 限制

令牌限制如下:

  • ML.GENERATE_TEXT:700 个输入令牌和 8196 个输出令牌。此输出令牌限制意味着,ML.GENERATE_TEXT 的单个音频片段的限制时间约为 39 分钟。
  • ML.TRANSCRIBE:没有令牌限制。不过,此函数对单个音频片段的限制为 480 分钟。

支持的语言

支持的语言如下:

区域可用性

推出区域如下:

  • ML.GENERATE_TEXT:在所有适用于 Vertex AI 的生成式 AI 区域提供。
  • ML.TRANSCRIBE:在 EUUS 多区域中提供,适用于所有语音识别器。