Hello 文本数据:设置项目和环境

如果您计划使用 Python 版 Vertex AI SDK,请确保初始化客户端的服务账号具有 Vertex AI Service Agent (roles/aiplatform.serviceAgent) IAM 角色。

在本教程的这一部分,您将设置 Google Cloud 项目以使用 Vertex AI 和 Cloud Storage 存储桶(用于存储训练 AutoML 模型的文档)。

本教程包含多个页面:

  1. 设置项目和环境。

  2. 创建文本分类数据集

  3. 训练 AutoML 文本分类模型。

  4. 将模型部署到端点并发送预测。

  5. 清理项目。

每个页面均假定您已经按照本教程中之前页面的说明操作。

设置您的项目和环境

在使用 Vertex AI 功能之前,完成以下步骤。

  1. 在 Google Cloud Console 中,转到项目选择器页面。

    转到“项目选择器”

  2. 选择或创建 Google Cloud 项目。

  3. 确保您的 Google Cloud 项目已启用结算功能

  4. 打开 Cloud Shell。 Cloud Shell 是 Google Cloud 的交互式 Shell 环境,可让您通过网络浏览器管理项目和资源。
  5. 转到 Cloud Shell
  6. 在 Cloud Shell 中,将当前项目设置为您的 Google Cloud 项目 ID,并将其存储在 projectid shell 变量中:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    PROJECT_ID 替换为项目 ID。您可以在 Google Cloud 控制台中找到项目 ID。如需了解详情,请参阅查找项目 ID
  7. Enable the IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI APIs:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. 向您的 Google 账号授予角色。对以下每个 IAM 角色运行以下命令一次: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • PROJECT_ID 替换为您的项目 ID。
    • EMAIL_ADDRESS 替换为您的电子邮件地址。
    • ROLE 替换为每个角色。
  9. Vertex AI User (roles/aiplatform.user) IAM 角色提供使用 Vertex AI 中所有资源的权限。借助 Storage Admin (roles/storage.admin),您可以将文档的训练数据集存储在 Cloud Storage 中。

创建 Cloud Storage 存储桶并复制示例数据集

创建一个 Cloud Storage 存储桶以存储用于训练 AutoML 模型的文档。

  1. 打开 Cloud Shell

  2. PROJECT_ID 变量设置为您的项目 ID。

    export PROJECT_ID=PROJECT_ID
  3. 设置 BUCKET 变量,您将使用此变量创建 Cloud Storage 存储桶。

    export BUCKET=${PROJECT_ID}-lcm
  4. 使用 BUCKET 变量在 us-central1 区域中创建 Cloud Storage 存储桶。

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. happiness.csv 示例训练数据集复制到存储桶中。

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

后续步骤

按照本教程的下一页操作,使用 Vertex AI 控制台创建文字分类数据集,并将复制的文档导入 Cloud Storage 存储桶。