Hello 文本数据:设置项目和环境

如果您计划使用 Python 版 Vertex AI SDK,请确保初始化客户端的服务账号具有 Vertex AI Service Agent (roles/aiplatform.serviceAgent) IAM 角色。

在本教程的这一部分,您将设置 Google Cloud 项目以使用 Vertex AI 和 Cloud Storage 存储桶(用于存储训练 AutoML 模型的文档)。

本教程包含多个页面:

  1. 设置项目和环境。

  2. 创建文本分类数据集

  3. 训练 AutoML 文本分类模型。

  4. 将模型部署到端点并发送预测。

  5. 清理项目。

每个页面均假定您已经按照本教程中之前页面的说明操作。

设置您的项目和环境

在使用 Vertex AI 功能之前,完成以下步骤。

  1. In the Google Cloud console, go to the project selector page.

    Go to project selector

  2. Select or create a Google Cloud project.

  3. Make sure that billing is enabled for your Google Cloud project.

  4. 打开 Cloud Shell。 Cloud Shell 是 Google Cloud 的交互式 Shell 环境,可让您通过网络浏览器管理项目和资源。
  5. 转到 Cloud Shell
  6. 在 Cloud Shell 中,将当前项目设置为您的 Google Cloud 项目 ID,并将其存储在 projectid shell 变量中:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    PROJECT_ID 替换为您的项目 ID。您可以在 Google Cloud 控制台中找到项目 ID。如需了解详情,请参阅查找项目 ID
  7. Enable the IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI APIs:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
    • Replace PROJECT_ID with your project ID.
    • Replace USER_IDENTIFIER with the identifier for your user account. For example, user:myemail@example.com.

    • Replace ROLE with each individual role.
  9. Vertex AI User (roles/aiplatform.user) IAM 角色提供使用 Vertex AI 中所有资源的权限。借助 Storage Admin (roles/storage.admin),您可以将文档的训练数据集存储在 Cloud Storage 中。

创建 Cloud Storage 存储桶并复制示例数据集

创建一个 Cloud Storage 存储桶以存储用于训练 AutoML 模型的文档。

  1. 打开 Cloud Shell

  2. PROJECT_ID 变量设置为您的项目 ID。

    export PROJECT_ID=PROJECT_ID
  3. 设置 BUCKET 变量,您将使用此变量创建 Cloud Storage 存储桶。

    export BUCKET=${PROJECT_ID}-lcm
  4. 使用 BUCKET 变量在 us-central1 区域中创建 Cloud Storage 存储桶。

    gcloud storage buckets create gs://${BUCKET}/ --project=${PROJECT_ID} --location=us-central1
  5. happiness.csv 示例训练数据集复制到存储桶中。

    gcloud storage cp gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/ --recursive

后续步骤

按照本教程的下一页操作,使用 Vertex AI 控制台创建文字分类数据集,并将复制的文档导入 Cloud Storage 存储桶。