Hello テキストデータ: テキスト分類データセットの作成とドキュメントのインポート

Vertex AI のコンソールを使用して、テキスト分類データセットを作成します。データセットを作成したら、Cloud Storage バケットにコピーした CSV を使用して、これらのドキュメントをデータセットにインポートします。

このチュートリアルには複数のページが含まれます。

  1. プロジェクトと環境の設定

  2. テキスト分類データセットの作成

  3. AutoML テキスト分類モデルのトレーニング

  4. エンドポイントへのモデルのデプロイと予測の送信

  5. プロジェクトのクリーンアップ

各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。

  1. Vertex AI コンソールに移動します。

  2. [Vertex AI スタートガイド] ページで [データセットを作成] をクリックします。

    Vertex AI ダッシュボード

  3. データセットの詳細を指定します。

    1. このデータセットの名前を指定します(例: text_classification_tutorial)。

    2. [Select a datatype and objective] セクションで、[テキスト] をクリックして [テキスト分類(単一ラベル)] を選択します。

    3. [リージョン] で [us-central1] を選択します。

      このチュートリアルでは us-central1 を使用しますが、Vertex AI は europe-west4 などの他のリージョンもサポートしています。

    4. [作成] をクリックして空のデータセットを作成し、ドキュメントをインポートします。

      新しいデータセット ウィンドウ

  4. インポート ページで、[ Cloud Storage からインポート ファイルを選択] を選択し、CSV ファイルの Cloud Storage の場所を指定します。

    このチュートリアルでは、CSV ファイルの場所は gs://${BUCKET}/text/happiness.csv にあります。このチュートリアルのバケットは、データセットと同じリージョンにありますが、どのリージョンにあるバケットも指定できます。

    インポート ウィンドウを選択する

  5. データ分割は [自動] のままにします。

    Vertex AI が、トレーニング セット、検証セット、テストセットにドキュメントを自動的に割り当てます。詳細については、AutoML モデルのデータ分割についてをご覧ください。

  6. [続行] をクリックして、インポートを開始します。

    インポートには数分かかります。インポートが完了したら、データセットの [参照] タブで、インポートされたすべてのドキュメントとそれに関連付けられたラベルを参照できます。

次のステップ

このチュートリアルの次のページの手順に沿って AutoML モデルのトレーニング ジョブを開始する。