Hello テキストデータ: プロジェクトと環境を設定する

Vertex AI SDK for Python を使用する場合は、クライアントを初期化するサービス アカウントに Vertex AI サービス エージェントroles/aiplatform.serviceAgent)IAM ロールが割り当てられていることを確認します。

チュートリアルのこのパートでは、Vertex AI と Cloud Storage バケットを使用するように Google Cloud プロジェクトを設定します。このバケットに AutoML モデルのトレーニングで使用するドキュメントを格納します。

このチュートリアルには複数のページが含まれます。

  1. プロジェクトと環境の設定

  2. テキスト分類データセットの作成

  3. AutoML テキスト分類モデルのトレーニング

  4. エンドポイントへのモデルのデプロイと予測の送信

  5. プロジェクトのクリーンアップ

各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。

プロジェクトと環境を設定する

Vertex AI の機能を使用する前に、次の手順を実施してください。

  1. Google Cloud コンソールでプロジェクトの選択ページに移動します。

    プロジェクト セレクタに移動

  2. Google Cloud プロジェクトを選択または作成します。

  3. Google Cloud プロジェクトで課金が有効になっていることを確認します

  4. Cloud Shell を開きます。Cloud Shell は Google Cloud のインタラクティブなシェル環境であり、ウェブブラウザからプロジェクトやリソースを管理できます。
  5. Cloud Shell に移動
  6. Cloud Shell で、現在のプロジェクトを Google Cloud プロジェクト ID に設定し、projectid シェル変数に格納します。
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    PROJECT_ID は実際のプロジェクト ID に置き換えます。プロジェクト ID は Google Cloud コンソールで確認できます。詳細については、プロジェクト ID を確認するをご覧ください。
  7. IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI API を有効にします。

    gcloud services enable iam.googleapis.com compute.googleapis.comnotebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Google アカウントにロールを付与します。次の IAM ロールごとに次のコマンドを 1 回実行します。 roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • PROJECT_ID は、実際のプロジェクト ID に置き換えます。
    • EMAIL_ADDRESS は実際のメールアドレスに置き換えます。
    • ROLE は、個々のロールに置き換えます。
  9. Vertex AI ユーザー(roles/aiplatform.user)IAM ロールにより、Vertex AI 内のすべてのリソースを使用するためのアクセス権が付与されます。ストレージ管理者roles/storage.admin)を使用すると、ドキュメントのトレーニング データセットを Cloud Storage に保存できます。

Cloud Storage バケットを作成してサンプル データセットをコピーする

AutoML モデルのトレーニングに使用するドキュメントを保存する Cloud Storage バケットを作成します。

  1. Cloud Shell を開きます

  2. PROJECT_ID 変数をプロジェクトの ID に設定します。

    export PROJECT_ID=PROJECT_ID
  3. Cloud Storage バケットの作成に使用する BUCKET 変数を設定します。

    export BUCKET=${PROJECT_ID}-lcm
  4. BUCKET 変数を使用して、us-central1 リージョンに Cloud Storage バケットを作成します。

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. happiness.csv サンプル トレーニング データセットをバケットにコピーします。

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

次のステップ

このチュートリアルの次のページに沿って、Vertex AI コンソールを使用してテキスト分類データセットを作成し、コピーしたドキュメントを Cloud Storage バケットにインポートします。