Hello 表形式データ: データセットの作成と AutoML 分類モデルのトレーニング

Google Cloud Console を使用して表形式のデータセットを作成し、分類モデルをトレーニングします。

このチュートリアルには複数のページが含まれます。

  1. プロジェクトと環境の設定

  2. 表形式のデータセットの作成と AutoML 分類モデルのトレーニング

  3. エンドポイントへのモデルのデプロイと予測の送信

  4. プロジェクトのクリーンアップ

各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。

表形式データセットを作成する

  1. Google Cloud Console の Vertex AI セクションで、[データセット] ページに移動します。

    [データセット] ページに移動

  2. ボタンバーの [作成] をクリックして、新しいデータセットを作成します。

  3. データセット名として「Structured_AutoML_Tutorial」と入力し、[表形式] タブを選択します。

    [リージョン] は us-central1 のままにします。

  4. [作成] をクリックして、データセットを作成します。

  5. [データソースの選択] で [Cloud Storage から CSV ファイルを選択] をクリックし、Cloud Storage パスとして「cloud-ml-tables-data/bank-marketing.csv」を入力します。

  6. [続行] をクリックします。

    [Analyze] ペインが開きます。

  7. [統計情報を生成] をクリックして、データセットの統計情報を生成します。

    統計情報が生成されたときに、いずれかの特徴をクリックすると、その特徴のデータの詳細が表示されます。

AutoML 分類モデルをトレーニングする

  1. [新しいモデルのトレーニング] をクリックします。

  2. [新しいモデルのトレーニング] ペインの [データセット] フィールドで、以前に作成したデータセットを選択し、[分類] を選択します。

  3. AutoML トレーニング メソッドが選択されていることを確認し、[続行] をクリックします。

  4. ターゲット列として [Deposit] を選択し、[続行] をクリックします。

    列のリストが表示され、各特徴に使用される変換が表示されます。

  5. [続行] をクリックして [コンピューティングと料金] パネルを表示し、トレーニング予算として「1」を入力します。

  6. [トレーニングを開始] をクリックします。

    トレーニング予算により実際のトレーニング時間が決まりますが、トレーニング完了までの時間には他のアクティビティも含まれるため、プロセス全体が 1 時間以上かかる場合があります。モデルのトレーニングが終了すると、[モデル] タブにライブリンクとして緑色のチェックマーク ステータス アイコンが表示されます。

次のステップ

このチュートリアルの次のページの手順に沿ってモデルをデプロイし、予測をリクエストする。