Hello テキストデータ: テキスト分類データセットの作成とドキュメントのインポート
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Vertex AI のコンソールを使用して、テキスト分類データセットを作成します。データセットを作成したら、Cloud Storage バケットにコピーした CSV を使用して、これらのドキュメントをデータセットにインポートします。
このチュートリアルには複数のページが含まれます。
プロジェクトと環境の設定
テキスト分類データセットの作成
AutoML テキスト分類モデルのトレーニング
エンドポイントへのモデルのデプロイと予測の送信
プロジェクトのクリーンアップ
各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。
Vertex AI コンソールに移動します。
[Vertex AI スタートガイド] ページで [データセットを作成] をクリックします。
データセットの詳細を指定します。
このデータセットの名前を指定します(例: text_classification_tutorial
)。
[データタイプと目標の選択] セクションで、[テキスト] をクリックして [テキスト分類(単一ラベル)] を選択します。
[リージョン] で [us-central1] を選択します。
このチュートリアルでは us-central1
を使用しますが、Vertex AI は europe-west4
などの他のリージョンもサポートしています。
[作成] をクリックして空のデータセットを作成し、ドキュメントをインポートします。
インポート ページで、[radio_button_checked インポート ファイルを Cloud Storage から選択] を選択し、CSV ファイルの Cloud Storage の場所を指定します。ヒント: [参照] をクリックして、[オブジェクトの選択] ダイアログで happiness.csv
ファイルを選択し、[選択] をクリックします。
このチュートリアルでは、CSV ファイルの場所は gs://${BUCKET}/text/happiness.csv
にあります。このチュートリアルのバケットは、データセットと同じリージョンにありますが、どのリージョンにあるバケットも指定できます。
データ分割はデフォルトのままにします。
Vertex AI が、トレーニング セット、検証セット、テストセットにドキュメントを自動的に割り当てます。詳細については、AutoML モデルのデータ分割についてをご覧ください。
[続行] をクリックして、インポートを開始します。
インポートには数分かかります。インポートが完了したら、データセットの [参照] タブで、インポートされたすべてのドキュメントとそれに関連付けられたラベルを参照できます。
次のステップ
このチュートリアルの次のページの手順に沿って AutoML モデルのトレーニング ジョブを開始する。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-02-14 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-02-14 UTC。"],[],[]]