选择自然语言处理函数

本文档对 BigQuery ML 中提供的自然语言处理函数进行了比较,这些函数分别为 ML.GENERATE_TEXTML.TRANSLATEML.UNDERSTAND_TEXT。在函数功能重叠的情况下,您可以使用本文档中的信息来帮助您确定要使用哪个函数。

概括来说,这些函数之间的区别如下:

  • ML.GENERATE_TEXT 非常适合以较低的成本执行自定义自然语言处理 (NLP) 任务。此函数提供更多语言支持、更快的吞吐量和模型调优功能,还可与多模态模型搭配使用。
  • ML.TRANSLATE 非常适合执行需要支持每分钟高查询率的特定于翻译的 NLP 任务。
  • ML.UNDERSTAND_TEXT 非常适合执行 Cloud Natural Language API 支持的 NLP 任务。

函数比较

您可以使用下表来比较 ML.GENERATE_TEXTML.TRANSLATEML.UNDERSTAND_TEXT 函数:

ML.GENERATE_TEXT ML.TRANSLATE ML.UNDERSTAND_TEXT
用途

通过将提示传递给 Gemini 或合作伙伴模型开放模型来执行任何 NLP 任务。

例如,若要执行问答任务,您可以提供类似于 CONCAT("What are the key concepts in the following article?: ", article_text) 的提示。

使用 Cloud Translation API 执行以下任务: 使用 Cloud Natural Language API 执行以下任务:
结算

会产生 BigQuery ML 数据处理费用。如需了解详情,请参阅 BigQuery ML 价格

调用模型会产生 Vertex AI 费用。如果您使用的是 Gemini 2.0 或更高版本的模型,则相应调用会按批量 API 费率计费。如需了解详情,请参阅 Vertex AI 中构建和部署 AI 模型的费用

会产生 BigQuery ML 数据处理费用。如需了解详情,请参阅 BigQuery ML 价格

调用 Cloud Translation API 会产生费用。如需了解详情,请参阅 Cloud Translation API 价格

会产生 BigQuery ML 数据处理费用。如需了解详情,请参阅 BigQuery ML 价格

调用 Cloud Natural Language API 会产生费用。如需了解详情,请参阅 Cloud Natural Language API 价格

每分钟请求数 不适用于 Gemini 模型。合作伙伴模型:25 到 60。如需了解详情,请参阅每分钟请求数限制 200。如需了解详情,请参阅 Cloud AI 服务功能 600。如需了解详情,请参阅 Cloud AI 服务功能
每分钟 token 数 范围从 8,192 到超过 100 万,具体取决于所用模型。 没有 token 限制。不过,ML_TRANSLATE 具有 30,000 字节限制 100,000
输入数据 支持来自 BigQuery 标准表和对象表的文本数据和非结构化数据。 支持来自 BigQuery 标准表的文本数据。 支持来自 BigQuery 标准表的文本数据。
函数输出 即使使用相同的提示,模型调用的输出也可能会有所不同。 对于每次成功调用 API,针对给定的任务类型生成相同的输出。输出包含有关输入语言的信息。 对于每次成功调用 API,针对给定的任务类型生成相同的输出。输出内容包括情感分析任务的情感幅度相关信息。
数据上下文 您可以提供数据上下文作为提交的提示的一部分。 不受支持。 不受支持。
监督式调优 某些模型支持监督式调优 不受支持。 不受支持。
支持的语言 支持因您选择的 LLM 而异。 支持 Cloud Translation API 语言 支持 Cloud Natural Language API 语言
支持的区域 在所有适用于 Vertex AI 的生成式 AI 区域均受支持。 EUUS 多区域支持。 EUUS 多区域支持。