使用控制台创建数据集

要创建机器学习模型,您必须先有一组用于训练的代表性数据。使用控制台(或 API)创建空数据集并将数据导入数据集。导入数据后,您可以进行修改并开始模型训练。

如需详细了解特定数据类型和目标的导入文件格式,请参阅以下页面:

创建数据集并导入或关联数据

请按照以下说明创建一个空数据集,然后导入或关联数据。

图片

  1. 在 Google Cloud Console 的 Vertex AI 部分中,转到数据集页面。

    转到“数据集”页面

  2. 点击创建以打开创建数据集详情页面。
  3. 修改数据集名称字段,以创建描述性的数据集显示名。
  4. 选择数据类型对应的标签页。
    选择数据类型
  5. 选择数据类型后,选择模型的目标。目标选项取决于所选数据类型。
  6. 区域下拉列表中选择一个区域。
  7. 点击创建以创建空数据集,并转到数据导入页面。
  8. 选择导入方法部分中选择以下选项之一:

    从您的计算机上传数据

    1. 选择导入方法部分,选择从计算机上传数据。
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的所有本地文件。
    3. 选择 Cloud Storage 路径部分中,点击浏览以选择要将数据上传到的 Cloud Storage 存储桶位置。

    从您的计算机上传导入文件

    1. 点击 Upload an import file from your computer
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的本地导入文件。
    3. 选择 Cloud Storage 路径部分中,点击浏览以选择要将文件上传到的 Cloud Storage 存储桶位置。

    从 Cloud Storage 中选择导入文件

    1. 点击 Select an import file from Cloud Storage
    2. 选择 Cloud Storage 路径部分中,点击浏览以选择 Cloud Storage 中的导入文件。
  9. 点击继续

    数据导入可能需要几个小时,具体取决于数据的大小。您可以关闭此标签页,稍后再返回。数据导入完成后,您会收到电子邮件。

表格

  1. 在 Google Cloud Console 的 Vertex AI 部分中,转到数据集页面。

    转到“数据集”页面

  2. 点击创建以打开创建数据集详情页面。
  3. 修改数据集名称字段,以创建描述性数据集显示名。
  4. 选择表格标签页。
  5. 选择目标(模型类型)。
  6. 区域下拉列表中选择一个区域。
  7. 如果您要将 CMEK(客户管理的加密密钥)与数据集搭配使用,请打开高级选项并提供密钥。(预览版
  8. 点击创建以创建空数据集,然后转到来源标签页。
  9. 根据数据源,选择以下选项之一。

    计算机上的 CSV 文件

    1. 点击 从计算机上传 CSV 文件
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的所有本地文件。
    3. 选择 Cloud Storage 路径部分中,输入 Cloud Storage 存储桶的路径,或点击浏览以选择存储桶位置。

    Cloud Storage 中的 CSV 文件

    1. 点击 选择 Cloud Storage 中的 CSV 文件
    2. 选择 Cloud Storage 中的 CSV 文件部分,输入 Cloud Storage 存储分区的路径,或点击浏览以选择 CSV 文件的位置。

    BigQuery 中的表或视图

    1. 点击 从 BigQuery 中选择表或视图
    2. 输入输入文件的项目、数据集和表 ID。
  10. 点击继续

    您的数据源已与您的数据集关联。

  11. 对于预测模型,请在分析标签页上,为此数据集指定时间列和时间序列标识符列。

    您还可以在训练模型时指定这些列,但预测数据集(预览版)通常具有特定时间和时间序列标识符列,因此最佳做法是在数据集中指定这些列。

文本

  1. 在 Google Cloud Console 的 Vertex AI 部分中,转到数据集页面。

    转到“数据集”页面

  2. 点击创建以打开创建数据集详情页面。
  3. 修改数据集名称字段,以创建描述性的数据集显示名。
  4. 选择数据类型对应的标签页。
    选择数据类型
  5. 选择数据类型后,选择模型的目标。目标选项取决于所选数据类型。
  6. 区域下拉列表中选择一个区域。
  7. 点击创建以创建空数据集,并转到数据导入页面。
  8. 选择导入方法部分中选择以下选项之一:

    从您的计算机上传数据

    1. 选择导入方法部分,选择从计算机上传数据。
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的所有本地文件。
    3. 选择 Cloud Storage 路径部分中,点击浏览以选择要将数据上传到的 Cloud Storage 存储桶位置。

    从您的计算机上传导入文件

    1. 点击 Upload an import file from your computer
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的本地导入文件。
    3. 选择 Cloud Storage 路径部分中,点击浏览以选择要将文件上传到的 Cloud Storage 存储桶位置。

    从 Cloud Storage 中选择导入文件

    1. 点击 Select an import file from Cloud Storage
    2. 选择 Cloud Storage 路径部分中,点击浏览以选择 Cloud Storage 中的导入文件。
  9. 点击继续

    数据导入可能需要几个小时,具体取决于数据的大小。您可以关闭此标签页,稍后再返回。数据导入完成后,您会收到电子邮件。

视频

  1. 在 Google Cloud Console 的 Vertex AI 部分中,转到数据集页面。

    转到“数据集”页面

  2. 点击创建以打开创建数据集详情页面。
  3. 修改数据集名称字段,以创建描述性的数据集显示名。
  4. 选择数据类型对应的标签页。
    选择数据类型
  5. 选择数据类型后,选择模型的目标。目标选项取决于所选数据类型。
  6. 区域下拉列表中选择一个区域。
  7. 点击创建以创建空数据集,并转到数据导入页面。
  8. 选择导入方法部分中选择以下选项之一:

    从您的计算机上传数据

    1. 选择导入方法部分,选择从计算机上传数据。
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的所有本地文件。
    3. 选择 Cloud Storage 路径部分中,点击浏览以选择要将数据上传到的 Cloud Storage 存储桶位置。

    从您的计算机上传导入文件

    1. 点击 Upload an import file from your computer
    2. 点击选择文件,然后选择要上传到 Cloud Storage 存储分区的本地导入文件。
    3. 选择 Cloud Storage 路径部分中,点击浏览以选择要将文件上传到的 Cloud Storage 存储桶位置。

    从 Cloud Storage 中选择导入文件

    1. 点击 Select an import file from Cloud Storage
    2. 选择 Cloud Storage 路径部分中,点击浏览以选择 Cloud Storage 中的导入文件。
  9. 点击继续

    数据导入可能需要几个小时,具体取决于数据的大小。您可以关闭此标签页,稍后再返回。数据导入完成后,您会收到电子邮件。

后续步骤