训练 AutoML 模型 (Cloud Console)

本页面介绍如何使用 Google Cloud Console 训练 AutoML 模型。

如需了解如何使用 Vertex AI API 训练 AutoML 模型,请参阅使用 Vertex AI API 训练 AutoML 模型

准备工作

在训练模型之前,您必须先准备好训练数据、创建数据集,并将数据与数据集关联。

训练 AutoML 模型

  1. 在 Google Cloud Console 的 Vertex AI 部分中,转到数据集页面。

    转到“数据集”页面

  2. 点击要用于训练模型的数据集的名称,以打开其详情页面。

  3. 如果您的数据类型使用注释集,请选择要用于此模型的注释集。

  4. 点击训练新模型

  5. 训练新模型页面中,根据数据类型完成以下步骤:

    图片

    1. 输入新模型的显示名。

    2. 如果您要手动设置训练数据的拆分方式,请展开高级选项,然后选择数据拆分选项。了解详情

    3. 点击继续

    4. 选择 AutoML 作为训练方法,然后点击继续

    5. 仅限对象检测模型:在优化您的模型 (Optimize your model) 部分中,选择要优化的选项(准确率或延迟时间)。

    6. 点击继续

    7. 计算和价格窗口中,输入模型训练小时数的上限。

      此设置有助于限制训练费用。实际所用的时间可能超过此值,因为创建新模型涉及其他操作。

    8. 如果要在模型无法再改进时停止训练,请选择启用早停法

    9. 点击开始训练

      模型训练可能需要几个小时,具体取决于数据的大小和复杂性,以及训练预算(如果指定)。您可以关闭此标签页,稍后再返回。模型完成训练后,您会收到电子邮件。

    表格

    选择目标。

    分类/回归

    1. 选择 AutoML 作为训练方法,然后点击继续

    2. 输入新模型的显示名。

    3. 选择目标列。

      目标列是模型将预测的值。

      详细了解目标列要求

    4. 如果您要将测试数据集导出到 BigQuery,请勾选将测试数据集导出到 BigQuery (Export test dataset to BigQuery) 并提供表的名称。

    5. 如果您想手动控制数据拆分,请打开高级选项

      默认数据拆分是随机的。根据您的数据,您可以选择手动来使用数据拆分列、控制数据拆分的百分比或提供时间列。详细了解数据拆分

    6. 点击继续

    7. 点击生成统计信息(如果您尚未生成)。

      生成统计信息会填充转换下拉菜单。

    8. 在“训练选项”页面上,查看列列表,并从训练中排除任何不应用于训练模型的列。

      如果您要使用数据拆分列,则应包含该列。

    9. 查看为包含的特征选择的转换,以及是否允许无效数据,并进行任何所需更新。

      详细了解转换无效数据

    10. 如果要指定权重列,或更改默认的优化目标,请打开高级选项并进行选择。

      详细了解权重列优化目标

    11. 点击继续

    12. 计算和价格窗口中,输入模型训练小时数的上限。

      此设置有助于限制训练费用。实际所用的时间可能超过此值,因为创建新模型涉及其他操作。

      建议的训练时间与训练数据的大小有关。 下表按行数显示了建议的训练时间范围;列数较多则所需训练时间更长。

      建议的训练时间
      少于 10 万 1 - 3 小时
      10 万 - 100 万 1 - 6 小时
      100 万 - 1000 万 1 - 12 小时
      超过 1000 万 3 - 24 小时

      如需了解训练价格,请参阅价格页面

    13. 点击开始训练

      模型训练可能需要几个小时,具体取决于数据的大小和复杂性,以及训练预算(如果指定)。您可以关闭此标签页,稍后再返回。模型完成训练后,您会收到电子邮件。

    预测

    1. 选择 AutoML 作为训练方法,然后点击继续

    2. 输入新模型的显示名。

    3. 选择目标列。

      目标列是模型将预测的值。详细了解目标列要求

    4. 如果您尚未对数据集设置序列标识符时间戳列,请立即选择它们。

    5. 选择您的数据粒度

      了解详情

    6. 输入您的上下文时段预测范围

      如果您未指定上下文时段,则其默认为为预测范围设置的值。如需了解详情,请参阅设置上下文时段和预测范围的注意事项

    7. 如果您要将测试数据集导出到 BigQuery,请勾选将测试数据集导出到 BigQuery (Export test dataset to BigQuery) 并提供表的名称。

    8. 如果您希望即使数据有验证错误 Vertex AI 仍继续训练,则可以选择忽略验证

      除非您了解数据错误的来源及其对模型质量的影响,否则应允许 Vertex AI 取消训练以验证错误。

    9. 如果您想手动控制数据拆分,请打开高级选项

      默认数据拆分按时间顺序,标准为 80/10/10 百分比。如果您想手动指定将哪些行分配给哪个拆分,请选择手动并指定数据拆分列。

      详细了解数据拆分

    10. 点击继续

    11. 点击生成统计信息(如果您尚未生成)。

      生成统计信息会填充转换下拉菜单。

    12. 在“训练选项”页面上,查看列列表,并从训练中排除任何不应用于训练模型的列。

      如果您要使用数据拆分列,则应包含该列。

    13. 查看为包含的特征选择的转换,并进行任何所需更新。

      系统会从训练中排除包含所选转换无效数据的行。详细了解转换

    14. 对于包含用于训练的每一列,请指定特征类型以获取该特征与其时间序列的关系,以及它在预测时是否可用。详细了解特征类型和可用性

    15. 如果要指定权重列,或更改默认的优化目标,请打开高级选项并进行选择。

      详细了解权重列优化目标

    16. 点击继续

    17. 计算和价格窗口中,输入模型训练小时数的上限。

      此设置有助于限制训练费用。实际所用的时间可能超过此值,因为创建新模型涉及其他操作。

      建议的训练时间与预测范围和训练数据的大小有关。下表提供一些预测训练运行示例,以及训练高质量模型所需的训练时间范围。

      功能 预测范围 训练时间
      1200 万 10 6 3-6 小时
      2000 万 50 13 6-12 小时
      1600 万 30 365 24-48 小时

      如需了解训练价格,请参阅价格页面

    18. 点击开始训练

      模型训练可能需要几个小时,具体取决于数据的大小和复杂性,以及训练预算(如果指定)。您可以关闭此标签页,稍后再返回。模型完成训练后,您会收到电子邮件。

    文本

    1. 训练方法选择 AutoML

    2. 点击继续

    3. 输入模型的名称。

    4. 如果您要手动设置训练数据的拆分方式,请展开高级选项,然后选择数据拆分选项。了解详情

    5. 点击开始训练

      模型训练可能需要几个小时,具体取决于数据的大小和复杂性,以及训练预算(如果指定)。您可以关闭此标签页,稍后再返回。模型完成训练后,您会收到电子邮件。

    视频

    1. 输入新模型的显示名。

    2. 如果您要手动设置训练数据的拆分方式,请展开高级选项,然后选择数据拆分选项。了解详情

    3. 点击继续

    4. 选择 AutoML 作为训练方法,然后点击继续

    5. 点击开始训练

      模型训练可能需要几个小时,具体取决于数据的大小和复杂性,以及训练预算(如果指定)。您可以关闭此标签页,稍后再返回。模型完成训练后,您会收到电子邮件。

      训练开始几分钟后,您即可在模型的属性信息中查看训练节点时的估算值。如果您取消训练,当前产品不会产生费用。

后续步骤