Hello テキストデータ: テキスト分類データセットの作成とドキュメントのインポート

Vertex AI のコンソールを使用して、テキスト分類データセットを作成します。データセットを作成したら、Cloud Storage バケットにコピーした CSV を使用して、これらのドキュメントをデータセットにインポートします。

このチュートリアルには複数のページが含まれます。

  1. プロジェクトと環境の設定

  2. テキスト分類データセットの作成

  3. AutoML テキスト分類モデルのトレーニング

  4. エンドポイントへのモデルのデプロイと予測の送信

  5. プロジェクトのクリーンアップ

各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。

  1. Vertex AI コンソールに移動します。

  2. [Vertex AI スタートガイド] ページで [データセットを作成] をクリックします。

  3. データセットの詳細を指定します。

    1. このデータセットの名前を指定します(例: text_classification_tutorial)。

    2. [データタイプと目標の選択] セクションで、[テキスト] をクリックして [テキスト分類(単一ラベル)] を選択します。

    3. [リージョン] で [us-central1] を選択します。

      このチュートリアルでは us-central1 を使用しますが、Vertex AI は europe-west4 などの他のリージョンもサポートしています。

    4. [作成] をクリックして空のデータセットを作成し、ドキュメントをインポートします。

  4. インポート ページで、[ インポート ファイルを Cloud Storage から選択] を選択し、CSV ファイルの Cloud Storage の場所を指定します。ヒント: [参照] をクリックして、[オブジェクトの選択] ダイアログで happiness.csv ファイルを選択し、[選択] をクリックします。

    このチュートリアルでは、CSV ファイルの場所は gs://${BUCKET}/text/happiness.csv にあります。このチュートリアルのバケットは、データセットと同じリージョンにありますが、どのリージョンにあるバケットも指定できます。

  5. データ分割はデフォルトのままにします。

    Vertex AI が、トレーニング セット、検証セット、テストセットにドキュメントを自動的に割り当てます。詳細については、AutoML モデルのデータ分割についてをご覧ください。

  6. [続行] をクリックして、インポートを開始します。

    インポートには数分かかります。インポートが完了したら、データセットの [参照] タブで、インポートされたすべてのドキュメントとそれに関連付けられたラベルを参照できます。

次のステップ

このチュートリアルの次のページの手順に沿って AutoML モデルのトレーニング ジョブを開始する。