Google Cloud コンソールを使用して画像分類データセットを作成します。データセットを作成したら、Cloud Storage の公開バケットにある画像を指す CSV を使用して、それらの画像をデータセットにインポートします。
このチュートリアルは、次のページから構成されています。
画像分類データセットを作成して画像をインポートします。
各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。
画像データ入力ファイル
このチュートリアルで使用する画像ファイルは、こちらの Tensorflow のブログ記事で使用されている花のデータセットからのものです。これらの入力画像は Cloud Storage の公開バケットに保存されます。この公開バケットには、データのインポートに使用する CSV ファイルも置かれています。このファイルには 2 つの列があります。最初の列には Cloud Storage 内の画像の URI、2 番目の列には画像のラベルを記述します。行の例をいくつか示します。
gs://cloud-samples-data/ai-platform/flowers/flowers.csv
:
gs://cloud-samples-data/ai-platform/flowers/daisy/10559679065_50d2b16f6d.jpg,daisy
gs://cloud-samples-data/ai-platform/flowers/dandelion/10828951106_c3cd47983f.jpg,dandelion
gs://cloud-samples-data/ai-platform/flowers/roses/14312910041_b747240d56_n.jpg,roses
gs://cloud-samples-data/ai-platform/flowers/sunflowers/127192624_afa3d9cb84.jpg,sunflowers
gs://cloud-samples-data/ai-platform/flowers/tulips/13979098645_50b9eebc02_n.jpg,tulips
画像分類データセットを作成してデータをインポートする
Google Cloud コンソールにアクセスして、データセットを作成し、画像分類モデルをトレーニングするプロセスを開始します。
プロンプトが表示されたら、Cloud Storage バケットに使用したプロジェクトを必ず選択します。
[Vertex AI スタートガイド] ページで [データセットを作成] をクリックします。
このデータセットの名前を指定します(省略可)。
[データタイプと目標の選択] セクションの [画像] タブで、[
画像分類(単一ラベル)] ラジオボタンを選択します。[リージョン] プルダウン メニューで、[US Central] を選択します。[作成] を選択して、空のデータセットを作成します。[作成] を選択すると、データのインポート ウィンドウに進みます。
[
インポート ファイルを Cloud Storage から選択] を選択し、画像の場所とラベルデータが記述された CSV ファイルの Cloud Storage URI を指定します。このクイックスタートでは、CSV ファイルは、gs://cloud-samples-data/ai-platform/flowers/flowers.csv
にあります。[インポート ファイルのパス] フィールドに、次の行をコピーして貼り付けます。cloud-samples-data/ai-platform/flowers/flowers.csv
[続行] を選択して、画像のインポートを開始します。インポートには数分かかります。完了すると、次のページが表示され、データセットに対して識別されたすべての画像(ラベル付きの画像とラベルなし画像の両方)が表示されます。
次のステップ
このチュートリアルの次のページの手順に沿って AutoML モデルのトレーニング ジョブを開始する。