使用 Google Cloud 控制台在 BigQuery ML 中创建机器学习模型

本文档介绍了如何使用 Google Cloud 控制台创建 BigQuery ML 模型。

所需的角色

  • 如需创建模型并运行推理,您必须获得以下角色:

    • BigQuery Data Editor (roles/bigquery.dataEditor)
    • BigQuery User (roles/bigquery.user)

准备工作

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Make sure that billing is enabled for your Google Cloud project.

  3. Enable the BigQuery and BigQuery Connection APIs.

    Enable the APIs

特定于模型的先决条件

在创建模型之前,请确保您已满足所创建模型类型的所有前提条件:

创建数据集

创建 BigQuery 数据集以包含您的资源:

控制台

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    转到 BigQuery 页面

  2. 探索器窗格中,点击您的项目名称。

  3. 点击 查看操作 > 创建数据集

  4. 创建数据集 页面上,执行以下操作:

    • 数据集 ID 中,输入数据集的名称。

    • 位置类型中,为数据集选择一个位置。

    • 点击创建数据集

bq

  1. 如需创建新数据集,请使用带有 --location 标志的 bq mk 命令:

    bq --location=LOCATION mk -d DATASET_ID

    替换以下内容:

    • LOCATION:数据集的位置
    • DATASET_ID 是您要创建的数据集的 ID。
  2. 确认已创建数据集:

    bq ls

创建内部或外部训练的模型

您可以使用此程序创建以下类型的模型:

这些模型具有不同的选项集,具体取决于其类型。虽然 BigQuery ML 自动调优在大多数情况下都能很好地发挥作用,但您也可以选择在过程中手动调优模型。如果您想这样做,请参阅相应模型类型的文档,详细了解模型选项。

如需创建模型,请执行以下操作:

  1. 转到 BigQuery 页面。

    转到 BigQuery

  2. 探索器窗格中,点击您创建的数据集。

  3. 点击数据集旁边的 查看操作,然后点击创建 BQML 模型

    系统会打开创建新模型窗格。

  4. 模型名称中,输入模型的名称。

  5. 如果您想创建包含模型 CREATE MODEL 语句的已保存的查询,请选择保存查询

    1. 对于查询名称,输入已保存查询的名称。
    2. 区域部分中,为已保存的查询选择一个区域。
  6. 点击继续

  7. 创建方法部分,选择在 BigQuery 中训练模型

  8. 建模目标部分中,为模型选择一个建模目标。

  9. 点击继续

  10. 模型选项页面上,选择模型类型。您可以选择的模型类型因所选的建模目标而异。

  11. 训练数据部分,执行以下操作之一:

    • 选择表/视图以从表或视图中获取训练数据,然后选择项目、数据集以及视图或表名称。
    • 选择查询以从已保存的查询中获取训练数据,然后选择已保存的查询。
  12. 所选输入标签列中,选择表格、视图或查询中要用作模型输入的列。

  13. 如果存在必需的选项部分,请指定所请求的列信息:

    • 对于分类模型和回归模型,请为 INPUT_LABEL_COLS 选择包含标签数据的列。
    • 对于矩阵分解模型,请选择以下内容:

      • 对于 RATING_COL,选择包含评分数据的列。
      • 对于 USER_COL,选择包含用户数据的列。
      • 对于 ITEM_COL,选择包含商品数据的列。
    • 对于时间序列预测模型,请选择以下内容:

      • 对于 TIME_SERIES_TIMESTAMP_COL,选择包含训练模型时要使用的时间点的列。
      • 对于 TIME_SERIES_DATA_COL,选择包含要预测的数据的列。
  14. 可选:在可选部分中,为其他模型调优实参指定值。可用的实参因您创建的模型类型而异。

  15. 点击创建模型

  16. 模型创建完成后,点击前往模型以查看模型详情。

基于预训练模型创建远程模型

使用此过程可创建以下类型的远程模型:

如需创建模型,请执行以下操作:

  1. 转到 BigQuery 页面。

    转到 BigQuery

  2. 探索器窗格中,点击您创建的数据集。

  3. 点击数据集旁边的 查看操作,然后点击创建 BQML 模型

    系统会打开创建新模型窗格。

  4. 模型名称中,输入模型的名称。

  5. 如果您想创建包含模型 CREATE MODEL 语句的已保存的查询,请选择保存查询

    1. 对于查询名称,输入已保存查询的名称。
    2. 区域部分中,为已保存的查询选择一个区域。
  6. 点击继续

  7. 创建方法部分中,选择连接到 Vertex AI LLM 服务和云 AI 服务

  8. 模型选项页面上,根据您的使用情形,为模型类型选择 Google 和合作伙伴模型开放模型

  9. 远程连接部分中,执行以下操作之一:

    • 如果您已配置默认连接,或者同时具有 BigQuery Admin 角色和 Project IAM Admin 角色,请选择默认连接
    • 如果您未配置默认连接,或者缺少适当的角色,请选择 Cloud 资源连接

      1. 项目字段中,选择包含要使用的连接的项目。
      2. 对于位置,选择连接使用的位置。
      3. 对于连接,请选择要用于远程模型的连接,或选择创建新连接以创建新连接。

  10. 必需选项部分中,执行以下操作之一:

    • 对于基于 Google 模型和合作伙伴模型的远程模型,请指定要使用的端点。这是模型的名称,例如 gemini-2.0-flash。如需详细了解支持的模型,请参阅 ENDPOINT
    • 对于基于开放模型的远程模型,请复制并粘贴要使用的端点。这是部署到 Vertex AI 的模型的共享公共端点,格式为 https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id。如需了解详情,请参阅 ENDPOINT
  11. 点击创建模型

  12. 模型创建完成后,点击前往模型以查看模型详情。

基于自定义模型创建远程模型

使用此程序可基于部署到 Vertex AI 的自定义模型创建远程模型。

如需创建模型,请执行以下操作:

  1. 转到 BigQuery 页面。

    转到 BigQuery

  2. 探索器窗格中,点击您创建的数据集。

  3. 点击数据集旁边的 查看操作,然后点击创建 BQML 模型

    系统会打开创建新模型窗格。

  4. 模型名称中,输入模型的名称。

  5. 如果您想创建包含模型 CREATE MODEL 语句的已保存的查询,请选择保存查询

    1. 对于查询名称,输入已保存查询的名称。
    2. 区域部分中,为已保存的查询选择一个区域。
  6. 点击继续

  7. 创建方法部分中,选择连接到用户管理的 Vertex AI 端点

  8. 模型选项页面的远程连接部分中,执行以下操作之一:

    • 如果您已配置默认连接,或者同时具有 BigQuery Admin 角色和 Project IAM Admin 角色,请选择默认连接
    • 如果您未配置默认连接,或者缺少适当的角色,请选择 Cloud 资源连接

      1. 项目字段中,选择包含要使用的连接的项目。
      2. 对于位置,选择连接使用的位置。
      3. 对于连接,请选择要用于远程模型的连接,或选择创建新连接以创建新连接。

  9. 必需选项部分中,指定要使用的端点。这是部署到 Vertex AI 的模型的共享公共端点,格式为 https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id。如需了解详情,请参阅 ENDPOINT

  10. 点击创建模型

  11. 模型创建完成后,点击前往模型以查看模型详情。

创建基于云 AI 服务的远程模型

使用此过程创建基于 Cloud AI 服务的远程模型。

如需创建模型,请执行以下操作:

  1. 转到 BigQuery 页面。

    转到 BigQuery

  2. 探索器窗格中,点击您创建的数据集。

  3. 点击数据集旁边的 查看操作,然后点击创建 BQML 模型

    系统会打开创建新模型窗格。

  4. 模型名称中,输入模型的名称。

  5. 如果您想创建包含模型 CREATE MODEL 语句的已保存的查询,请选择保存查询

    1. 对于查询名称,输入已保存查询的名称。
    2. 区域部分中,为已保存的查询选择一个区域。
  6. 点击继续

  7. 创建方法部分中,选择连接到 Vertex AI LLM 服务和云 AI 服务

  8. 模型选项页面上,选择 Cloud AI 服务

  9. 远程连接部分中,执行以下操作之一:

    • 如果您已配置默认连接,或者同时具有 BigQuery Admin 角色和 Project IAM Admin 角色,请选择默认连接
    • 如果您未配置默认连接,或者缺少适当的角色,请选择 Cloud 资源连接

      1. 项目字段中,选择包含要使用的连接的项目。
      2. 对于位置,选择连接使用的位置。
      3. 对于连接,请选择要用于远程模型的连接,或选择创建新连接以创建新连接。

  10. 必需选项部分中,选择要使用的 Cloud AI 服务类型。

  11. 可选部分中,如果您使用的是 CLOUD_AI_DOCUMENT_V1 服务,请指定文档处理器信息。如果您使用的是 CLOUD_AI_SPEECH_TO_TEXT_V2 服务,则可以选择指定语音识别器信息。

  12. 点击创建模型

  13. 模型创建完成后,点击前往模型以查看模型详情。

创建导入的模型

您可以使用此程序通过导入以下类型的模型来创建 BigQuery ML 模型:

如需创建模型,请执行以下操作:

  1. 转到 BigQuery 页面。

    转到 BigQuery

  2. 探索器窗格中,点击您创建的数据集。

  3. 点击数据集旁边的 查看操作,然后点击创建 BQML 模型

    系统会打开创建新模型窗格。

  4. 模型名称中,输入模型的名称。

  5. 如果您想创建包含模型 CREATE MODEL 语句的已保存的查询,请选择保存查询

    1. 对于查询名称,输入已保存查询的名称。
    2. 区域部分中,为已保存的查询选择一个区域。
  6. 点击继续

  7. 创建方法部分中,选择导入模型

  8. 模型选项页面上,选择要导入的模型类型。

  9. GCS 路径中,浏览或粘贴包含模型的 Cloud Storage 存储桶的 URI。

  10. 点击创建模型

  11. 模型创建完成后,点击前往模型以查看模型详情。