フィードバックを送信
Hello テキストデータ: テキスト分類データセットの作成とドキュメントのインポート
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
2024 年 9 月 15 日以降、分類、エンティティ抽出、感情分析の目標をカスタマイズするには、Vertex AI Gemini のプロンプトとチューニングに移行する必要があります。Vertex AI AutoML Text のモデルを、分類、エンティティ抽出、感情分析の目標に向けてトレーニングまたは更新することはできなくなります。既存の Vertex AI AutoML Text モデルは、2025 年 6 月 15 日まで引き続き使用できます。AutoML Text と Gemini の比較については、AutoML Text ユーザー向けの Gemini をご覧ください。プロンプト機能の向上による Gemini のユーザー エクスペリエンスの改善について詳しくは、チューニングの概要 をご覧ください。チューニングを開始するには、Gemini テキストモデルのモデル チューニング をご覧ください。
Vertex AI のコンソールを使用して、テキスト分類データセットを作成します。データセットを作成したら、Cloud Storage バケットにコピーした CSV を使用して、これらのドキュメントをデータセットにインポートします。
このチュートリアルには複数のページが含まれます。
プロジェクトと環境の設定
テキスト分類データセットの作成
AutoML テキスト分類モデルのトレーニング
エンドポイントへのモデルのデプロイと予測の送信
プロジェクトのクリーンアップ
各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。
Vertex AI コンソール に移動します。
[Vertex AI スタートガイド ] ページで [データセットを作成 ] をクリックします。
データセットの詳細を指定します。
このデータセットの名前を指定します(例: text_classification_tutorial
)。
[データタイプと目標の選択 ] セクションで、[テキスト ] をクリックして [テキスト分類(単一ラベル) ] を選択します。
[リージョン ] で [us-central1 ] を選択します。
このチュートリアルでは us-central1
を使用しますが、Vertex AI は europe-west4
などの他のリージョンもサポートしています。
[作成 ] をクリックして空のデータセットを作成し、ドキュメントをインポートします。
インポート ページで、[radio_button_checked インポート ファイルを Cloud Storage から選択 ] を選択し、CSV ファイルの Cloud Storage の場所を指定します。ヒント : [参照 ] をクリックして、[オブジェクトの選択 ] ダイアログで happiness.csv
ファイルを選択し、[選択 ] をクリックします。
このチュートリアルでは、CSV ファイルの場所は gs://${BUCKET}/text/happiness.csv
にあります。このチュートリアルのバケットは、データセットと同じリージョンにありますが、どのリージョンにあるバケットも指定できます。
データ分割はデフォルト のままにします。
Vertex AI が、トレーニング セット、検証セット、テストセットにドキュメントを自動的に割り当てます。詳細については、AutoML モデルのデータ分割について をご覧ください。
[続行 ] をクリックして、インポートを開始します。
インポートには数分かかります。インポートが完了したら、データセットの [参照 ] タブで、インポートされたすべてのドキュメントとそれに関連付けられたラベルを参照できます。
次のステップ
このチュートリアルの次のページ の手順に沿って AutoML モデルのトレーニング ジョブを開始する。
フィードバックを送信
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンス により使用許諾されます。コードサンプルは Apache 2.0 ライセンス により使用許諾されます。詳しくは、Google Developers サイトのポリシー をご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-11-20 UTC。
ご意見をお聞かせください
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2024-11-20 UTC。"],[],[]]