使用 Google Cloud 控制台在 BigQuery ML 中创建机器学习模型
本文档介绍了如何使用 Google Cloud 控制台创建 BigQuery ML 模型。
所需的角色
如需创建模型并运行推理,您必须获得以下角色:
- BigQuery Data Editor (
roles/bigquery.dataEditor
) - BigQuery User (
roles/bigquery.user
)
- BigQuery Data Editor (
准备工作
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and BigQuery Connection APIs.
特定于模型的先决条件
在创建模型之前,请确保您已满足所创建模型类型的所有前提条件:
如果您想使用查询来选择模型的训练数据,则必须将该查询作为已保存的查询提供。
矩阵分解模型需要预留。如需了解详情,请参阅价格。
以下远程模型需要 Cloud 资源连接:
连接的服务账号还必须获得特定角色,具体取决于远程模型的类型。
如需导入模型,您必须先将该模型上传到 Cloud Storage 存储桶。
创建数据集
创建 BigQuery 数据集以包含您的资源:
控制台
在 Google Cloud 控制台中,前往 BigQuery 页面。
在探索器窗格中,点击您的项目名称。
点击
查看操作 > 创建数据集。在 创建数据集 页面上,执行以下操作:
在数据集 ID 中,输入数据集的名称。
在位置类型中,为数据集选择一个位置。
点击创建数据集。
bq
创建内部或外部训练的模型
您可以使用此程序创建以下类型的模型:
这些模型具有不同的选项集,具体取决于其类型。虽然 BigQuery ML 自动调优在大多数情况下都能很好地发挥作用,但您也可以选择在过程中手动调优模型。如果您想这样做,请参阅相应模型类型的文档,详细了解模型选项。
如需创建模型,请执行以下操作:
转到 BigQuery 页面。
在探索器窗格中,点击您创建的数据集。
点击数据集旁边的
查看操作,然后点击创建 BQML 模型。系统会打开创建新模型窗格。
在模型名称中,输入模型的名称。
如果您想创建包含模型
CREATE MODEL
语句的已保存的查询,请选择保存查询。- 对于查询名称,输入已保存查询的名称。
- 在区域部分中,为已保存的查询选择一个区域。
点击继续。
在创建方法部分,选择在 BigQuery 中训练模型。
在建模目标部分中,为模型选择一个建模目标。
点击继续。
在模型选项页面上,选择模型类型。您可以选择的模型类型因所选的建模目标而异。
在训练数据部分,执行以下操作之一:
- 选择表/视图以从表或视图中获取训练数据,然后选择项目、数据集以及视图或表名称。
- 选择查询以从已保存的查询中获取训练数据,然后选择已保存的查询。
在所选输入标签列中,选择表格、视图或查询中要用作模型输入的列。
如果存在必需的选项部分,请指定所请求的列信息:
- 对于分类模型和回归模型,请为 INPUT_LABEL_COLS 选择包含标签数据的列。
对于矩阵分解模型,请选择以下内容:
- 对于 RATING_COL,选择包含评分数据的列。
- 对于 USER_COL,选择包含用户数据的列。
- 对于 ITEM_COL,选择包含商品数据的列。
对于时间序列预测模型,请选择以下内容:
- 对于 TIME_SERIES_TIMESTAMP_COL,选择包含训练模型时要使用的时间点的列。
- 对于 TIME_SERIES_DATA_COL,选择包含要预测的数据的列。
可选:在可选部分中,为其他模型调优实参指定值。可用的实参因您创建的模型类型而异。
点击创建模型。
模型创建完成后,点击前往模型以查看模型详情。
基于预训练模型创建远程模型
使用此过程可创建以下类型的远程模型:
如需创建模型,请执行以下操作:
转到 BigQuery 页面。
在探索器窗格中,点击您创建的数据集。
点击数据集旁边的
查看操作,然后点击创建 BQML 模型。系统会打开创建新模型窗格。
在模型名称中,输入模型的名称。
如果您想创建包含模型
CREATE MODEL
语句的已保存的查询,请选择保存查询。- 对于查询名称,输入已保存查询的名称。
- 在区域部分中,为已保存的查询选择一个区域。
点击继续。
在创建方法部分中,选择连接到 Vertex AI LLM 服务和云 AI 服务。
在模型选项页面上,根据您的使用情形,为模型类型选择 Google 和合作伙伴模型或开放模型。
在远程连接部分中,执行以下操作之一:
- 如果您已配置默认连接,或者同时具有 BigQuery Admin 角色和 Project IAM Admin 角色,请选择默认连接。
如果您未配置默认连接,或者缺少适当的角色,请选择 Cloud 资源连接。
- 在项目字段中,选择包含要使用的连接的项目。
- 对于位置,选择连接使用的位置。
对于连接,请选择要用于远程模型的连接,或选择创建新连接以创建新连接。
在必需选项部分中,执行以下操作之一:
点击创建模型。
模型创建完成后,点击前往模型以查看模型详情。
基于自定义模型创建远程模型
使用此程序可基于部署到 Vertex AI 的自定义模型创建远程模型。
如需创建模型,请执行以下操作:
转到 BigQuery 页面。
在探索器窗格中,点击您创建的数据集。
点击数据集旁边的
查看操作,然后点击创建 BQML 模型。系统会打开创建新模型窗格。
在模型名称中,输入模型的名称。
如果您想创建包含模型
CREATE MODEL
语句的已保存的查询,请选择保存查询。- 对于查询名称,输入已保存查询的名称。
- 在区域部分中,为已保存的查询选择一个区域。
点击继续。
在创建方法部分中,选择连接到用户管理的 Vertex AI 端点。
在模型选项页面的远程连接部分中,执行以下操作之一:
- 如果您已配置默认连接,或者同时具有 BigQuery Admin 角色和 Project IAM Admin 角色,请选择默认连接。
如果您未配置默认连接,或者缺少适当的角色,请选择 Cloud 资源连接。
- 在项目字段中,选择包含要使用的连接的项目。
- 对于位置,选择连接使用的位置。
对于连接,请选择要用于远程模型的连接,或选择创建新连接以创建新连接。
在必需选项部分中,指定要使用的端点。这是部署到 Vertex AI 的模型的共享公共端点,格式为
https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id
。如需了解详情,请参阅ENDPOINT
。点击创建模型。
模型创建完成后,点击前往模型以查看模型详情。
创建基于云 AI 服务的远程模型
使用此过程创建基于 Cloud AI 服务的远程模型。
如需创建模型,请执行以下操作:
转到 BigQuery 页面。
在探索器窗格中,点击您创建的数据集。
点击数据集旁边的
查看操作,然后点击创建 BQML 模型。系统会打开创建新模型窗格。
在模型名称中,输入模型的名称。
如果您想创建包含模型
CREATE MODEL
语句的已保存的查询,请选择保存查询。- 对于查询名称,输入已保存查询的名称。
- 在区域部分中,为已保存的查询选择一个区域。
点击继续。
在创建方法部分中,选择连接到 Vertex AI LLM 服务和云 AI 服务。
在模型选项页面上,选择 Cloud AI 服务。
在远程连接部分中,执行以下操作之一:
- 如果您已配置默认连接,或者同时具有 BigQuery Admin 角色和 Project IAM Admin 角色,请选择默认连接。
如果您未配置默认连接,或者缺少适当的角色,请选择 Cloud 资源连接。
- 在项目字段中,选择包含要使用的连接的项目。
- 对于位置,选择连接使用的位置。
对于连接,请选择要用于远程模型的连接,或选择创建新连接以创建新连接。
在必需选项部分中,选择要使用的 Cloud AI 服务类型。
在可选部分中,如果您使用的是
CLOUD_AI_DOCUMENT_V1
服务,请指定文档处理器信息。如果您使用的是CLOUD_AI_SPEECH_TO_TEXT_V2
服务,则可以选择指定语音识别器信息。点击创建模型。
模型创建完成后,点击前往模型以查看模型详情。
创建导入的模型
您可以使用此程序通过导入以下类型的模型来创建 BigQuery ML 模型:
如需创建模型,请执行以下操作:
转到 BigQuery 页面。
在探索器窗格中,点击您创建的数据集。
点击数据集旁边的
查看操作,然后点击创建 BQML 模型。系统会打开创建新模型窗格。
在模型名称中,输入模型的名称。
如果您想创建包含模型
CREATE MODEL
语句的已保存的查询,请选择保存查询。- 对于查询名称,输入已保存查询的名称。
- 在区域部分中,为已保存的查询选择一个区域。
点击继续。
在创建方法部分中,选择导入模型。
在模型选项页面上,选择要导入的模型类型。
在 GCS 路径中,浏览或粘贴包含模型的 Cloud Storage 存储桶的 URI。
点击创建模型。
模型创建完成后,点击前往模型以查看模型详情。