画像ラベル付けリクエストの送信

AI Platform Data Labeling Service では、次の 6 種類の画像ラベル付けタスクがサポートされています。

  • 分類タスク。ラベラーは各画像に 1 つ以上のラベルを割り当てます。
  • 境界ボックス。ラベラーはラベルを選択し、画像内のそのラベルを適用する 1 か所以上の部分に境界ボックスを描画します。
  • 有向境界ボックスタスク。これは境界ボックスタスクと似ていますが、境界ボックスは x 軸と平行になるのに対し、有向境界ボックスは任意の向きにできます。
  • 境界ポリゴンタスク。これも境界ボックスに似ています。ラベラーはラベルを選択した後、画像内のそのラベルを適用する部分を閉じたポリゴンで囲みます。
  • ポリライン タスク。これも境界ボックスに似ています。ラベラーはラベルを選択した後、画像内のそのラベルを適用する部分にポリラインを描画します。ポリラインは、線分の末端として接続された少なくとも 2 つの点を含むリストで構成されます。
  • セグメンテーション タスク。ラベラーはラベルごとにマスクを作成します。出力は、ラベルと色とがマッピングされたカラー マッピング テーブルになります。

画像分類タスク

ウェブ UI

  1. Data Labeling Service UI を開きます。

  2. 左側のナビゲーションから [データセット] を選択します。

    [データセット] ページに、現在のプロジェクトでこれまでに作成されたデータセットのステータスが表示されます。

  3. ラベル付けサービスに送信するデータセットの名前をクリックします。

    ステータスが「インポート完了」になっているデータセットを送信できます。[データの種類] 列は、そのデータセットに画像、動画、テキストのいずれが含まれているかを示します。

  4. [データセットの詳細] ページで、タイトルバーにある [Create labeling task] ボタンをクリックします。

  5. [新しいラベル付けタスク] ページで、アノテーション付きデータセットの名前と説明を入力します。

    このアノテーション付きデータセットは、ラベル付け担当者がこのデータセットにラベルを付けた結果です。

  6. [目的] プルダウンから、このデータセットに対して行うラベル付けタスクの種類を選択します。

    このプルダウン リストには、選択したデータセット内のデータの種類に対して使用できる目的のみが含まれます。必要な目的がプルダウン リストにない場合は、おそらく別の種類のデータを含むデータセットを選択しています。[新しいラベル付けタスク] ページを閉じて、別のデータセットを選択します。

  7. [ラベルセット] プルダウンから、ラベラーがこのデータセット内のデータ項目に適用するラベルセットを選択します。

    このプルダウン リストには、現在のプロジェクトに関連付けられているすべてのラベルセットが含まれます。ラベルセットを選択する必要があります。

  8. [手順] プルダウンから、このデータセットの作業を行うラベル付け担当者向けの指示を選択します。

    このプルダウン リストには、現在のプロジェクトに関連付けられているすべての指示が含まれます。ラベル付けリクエストには必ず指示を含める必要があります。

  9. [labelers per data item] プルダウンから、データセット内の各項目をレビューするラベラーの人数を指定します。

    デフォルトは 1 人ですが、3 人または 5 人のラベラーが各項目のラベル付けを行うようにリクエストできます。

  10. チェックボックスをオンにして、ラベル付けの料金について理解したことを示します。

  11. [作成] をクリックします。

コマンドライン

次の環境変数を設定します。
  1. Google Cloud プロジェクト ID を示す PROJECT_ID 変数。
  2. データセットの ID を示す DATASET_ID 変数。データセットの ID はデータセットの作成時にレスポンスで返されます。この ID は完全なデータセット名の最後の部分です。

    projects/PROJECT_ID/locations/us-central1/datasets/DATASET_ID
  3. 指示リソースの名前を示す INSTRUCTION_RESOURCE_NAME
  4. ラベルセット リソースの名前を示す ANNOTATION_SPEC_SET_RESOURCE_NAME
curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
  -H "Content-Type: application/json" \
  https://datalabeling.googleapis.com/v1beta1/projects/${PROJECT_ID}/datasets/${DATASET_ID}/image:label \
  -d '{
  "basicConfig": {
    "instruction": "${INSTRUCTION_RESOURCE_NAME}",
    "annotatedDatasetDisplayName": "curl_testing_annotated_dataset",
    "labelGroup": "test_label_group",
    "replica_count": 1
  },
  "feature": "TEXT_CLASSIFICATION",
  "imageClassificationConfig": {
    "annotationSpecSet": "${ANNOTATION_SPEC_SET_RESOURCE_NAME}",
  },
}'

出力は次のようになります。オペレーション ID を使用して、タスクのステータスを取得できます。たとえば、オペレーションのステータスを取得できます。

{
  "name": "projects/data-labeling-codelab/operations/5c73dd6b_0000_2b34_a920_883d24fa2064",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.data-labeling.v1beta1.LabelImageClassificationOperationMetadata",
    "dataset": "projects/data-labeling-codelab/datasets/5c73db3d_0000_23e0_a25b_94eb2c119c4c"
  }
}

Python

このサンプルコードを実行するには、あらかじめ Python クライアント ライブラリをインストールしておく必要があります。

def label_image(
    dataset_resource_name, instruction_resource_name, annotation_spec_set_resource_name
):
    """Labels an image dataset."""
    from google.cloud import datalabeling_v1beta1 as datalabeling

    client = datalabeling.DataLabelingServiceClient()

    basic_config = datalabeling.HumanAnnotationConfig(
        instruction=instruction_resource_name,
        annotated_dataset_display_name="YOUR_ANNOTATED_DATASET_DISPLAY_NAME",
        label_group="YOUR_LABEL_GROUP",
        replica_count=1,
    )

    feature = datalabeling.LabelImageRequest.Feature.CLASSIFICATION

    # annotation_spec_set_resource_name needs to be created beforehand.
    # See the examples in the following:
    # https://cloud.google.com/ai-platform/data-labeling/docs/label-sets
    config = datalabeling.ImageClassificationConfig(
        annotation_spec_set=annotation_spec_set_resource_name,
        allow_multi_label=False,
        answer_aggregation_type=datalabeling.StringAggregationType.MAJORITY_VOTE,
    )

    response = client.label_image(
        request={
            "parent": dataset_resource_name,
            "basic_config": basic_config,
            "feature": feature,
            "image_classification_config": config,
        }
    )

    print(f"Label_image operation name: {response.operation.name}")
    return response

Java

このサンプルコードを実行するには、あらかじめ Java クライアント ライブラリをインストールしておく必要があります。
import com.google.api.gax.longrunning.OperationFuture;
import com.google.cloud.datalabeling.v1beta1.AnnotatedDataset;
import com.google.cloud.datalabeling.v1beta1.DataLabelingServiceClient;
import com.google.cloud.datalabeling.v1beta1.DataLabelingServiceSettings;
import com.google.cloud.datalabeling.v1beta1.HumanAnnotationConfig;
import com.google.cloud.datalabeling.v1beta1.ImageClassificationConfig;
import com.google.cloud.datalabeling.v1beta1.LabelImageRequest;
import com.google.cloud.datalabeling.v1beta1.LabelImageRequest.Feature;
import com.google.cloud.datalabeling.v1beta1.LabelOperationMetadata;
import com.google.cloud.datalabeling.v1beta1.StringAggregationType;
import java.io.IOException;
import java.util.concurrent.ExecutionException;

class LabelImage {

  // Start an Image Labeling Task
  static void labelImage(
      String formattedInstructionName,
      String formattedAnnotationSpecSetName,
      String formattedDatasetName)
      throws IOException {
    // String formattedInstructionName = DataLabelingServiceClient.formatInstructionName(
    //      "YOUR_PROJECT_ID", "YOUR_INSTRUCTION_UUID");
    // String formattedAnnotationSpecSetName =
    //     DataLabelingServiceClient.formatAnnotationSpecSetName(
    //         "YOUR_PROJECT_ID", "YOUR_ANNOTATION_SPEC_SET_UUID");
    // String formattedDatasetName = DataLabelingServiceClient.formatDatasetName(
    //      "YOUR_PROJECT_ID", "YOUR_DATASET_UUID");

    DataLabelingServiceSettings settings =
        DataLabelingServiceSettings.newBuilder()
            .build();
    try (DataLabelingServiceClient dataLabelingServiceClient =
        DataLabelingServiceClient.create(settings)) {
      HumanAnnotationConfig humanAnnotationConfig =
          HumanAnnotationConfig.newBuilder()
              .setAnnotatedDatasetDisplayName("annotated_displayname")
              .setAnnotatedDatasetDescription("annotated_description")
              .setInstruction(formattedInstructionName)
              .build();

      ImageClassificationConfig imageClassificationConfig =
          ImageClassificationConfig.newBuilder()
              .setAllowMultiLabel(true)
              .setAnswerAggregationType(StringAggregationType.MAJORITY_VOTE)
              .setAnnotationSpecSet(formattedAnnotationSpecSetName)
              .build();

      LabelImageRequest labelImageRequest =
          LabelImageRequest.newBuilder()
              .setParent(formattedDatasetName)
              .setBasicConfig(humanAnnotationConfig)
              .setImageClassificationConfig(imageClassificationConfig)
              .setFeature(Feature.CLASSIFICATION)
              .build();

      OperationFuture<AnnotatedDataset, LabelOperationMetadata> operation =
          dataLabelingServiceClient.labelImageAsync(labelImageRequest);

      // You'll want to save this for later to retrieve your completed operation.
      System.out.format("Operation Name: %s\n", operation.getName());

      // Cancel the operation to avoid charges when testing.
      dataLabelingServiceClient.getOperationsClient().cancelOperation(operation.getName());

    } catch (IOException | InterruptedException | ExecutionException e) {
      e.printStackTrace();
    }
  }
}

境界ボックス

ウェブ UI

  1. Data Labeling Service UI を開きます。

  2. 左側のナビゲーションから [データセット] を選択します。

    [データセット] ページに、現在のプロジェクトでこれまでに作成されたデータセットのステータスが表示されます。

  3. ラベル付けサービスに送信するデータセットの名前をクリックします。

    ステータスが「インポート完了」になっているデータセットを送信できます。[データの種類] 列は、そのデータセットに画像、動画、テキストのいずれが含まれているかを示します。

  4. [データセットの詳細] ページで、タイトルバーにある [Create labeling task] ボタンをクリックします。

  5. [新しいラベル付けタスク] ページで、アノテーション付きデータセットの名前と説明を入力します。

    このアノテーション付きデータセットは、ラベル付け担当者がこのデータセットにラベルを付けた結果です。

  6. [目的] プルダウンから、このデータセットに対して行うラベル付けタスクの種類を選択します。

    このプルダウン リストには、選択したデータセット内のデータの種類に対して使用できる目的のみが含まれます。必要な目的がプルダウン リストにない場合は、おそらく別の種類のデータを含むデータセットを選択しています。[新しいラベル付けタスク] ページを閉じて、別のデータセットを選択します。

  7. [ラベルセット] プルダウンから、ラベラーがこのデータセット内のデータ項目に適用するラベルセットを選択します。

    このプルダウン リストには、現在のプロジェクトに関連付けられているすべてのラベルセットが含まれます。ラベルセットを選択する必要があります。

  8. [手順] プルダウンから、このデータセットの作業を行うラベル付け担当者向けの指示を選択します。

    このプルダウン リストには、現在のプロジェクトに関連付けられているすべての指示が含まれます。ラベル付けリクエストには必ず指示を含める必要があります。

  9. [labelers per data item] プルダウンから、データセット内の各項目をレビューするラベラーの人数を指定します。

    デフォルトは 1 人ですが、3 人または 5 人のラベラーが各項目のラベル付けを行うようにリクエストできます。

  10. チェックボックスをオンにして、ラベル付けの料金について理解したことを示します。

  11. [作成] をクリックします。

コマンドライン

次の環境変数を設定します。
  1. Google Cloud プロジェクト ID を示す PROJECT_ID 変数。
  2. データセットの ID を示す DATASET_ID 変数。データセットの ID はデータセットの作成時にレスポンスで返されます。この ID は完全なデータセット名の最後の部分です。

    projects/PROJECT_ID/locations/us-central1/datasets/DATASET_ID
  3. 指示リソースの名前を示す INSTRUCTION_RESOURCE_NAME
  4. ラベルセット リソースの名前を示す ANNOTATION_SPEC_SET_RESOURCE_NAME
curl -X POST \
  -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
  -H "Content-Type: application/json" \
  https://datalabeling.googleapis.com/v1beta1/projects/${PROJECT_ID}/datasets/${DATASET_ID}/image:label \
  -d '{
  "basicConfig": {
    "instruction": "${INSTRUCTION_RESOURCE_NAME}",
    "annotatedDatasetDisplayName": "curl_testing_annotated_dataset",
    "labelGroup": "test_label_group",
    "replica_count": 1
  },
  "feature": "BOUNDING_BOX",
  "boundingPolyConfig": {
    "annotationSpecSet": "${ANNOTATION_SPEC_SET_RESOURCE_NAME}",
  },
}'

出力は次のようになります。オペレーション ID を使用して、タスクのステータスを取得できます。たとえば、オペレーションのステータスを取得できます。

{
  "name": "projects/data-labeling-codelab/operations/5c73dd6b_0000_2b34_a920_883d24fa2064",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.data-labeling.v1beta1.LabelImageBoundingBoxOperationMetadata",
    "dataset": "projects/data-labeling-codelab/datasets/5c73db3d_0000_23e0_a25b_94eb2c119c4c"
  }
}