이미지 라벨링 요청 제출

AI Platform 데이터 라벨링 서비스에서는 6가지 유형의 이미지 라벨링 작업을 지원합니다.

  • 분류에서는 라벨러가 각 이미지에 하나 이상의 라벨을 지정합니다.
  • 경계 상자에서는 라벨러가 라벨을 선택하고 경계 상자를 하나 이상 그려 라벨을 이미지의 일부에 적용합니다.
  • 방향 지정 경계 상자 태스크는 경계 상자 태스크와 비슷하지만, 경계 상자는 x축으로 정렬되는 반면 방향 지정 경계 상자는 방향이 제한되지 않습니다.
  • 경계 다각형은 경계 상자와 비슷하지만, 경계 다각형에서 라벨러는 라벨을 선택하고 닫힌 다각형을 그려 라벨을 이미지의 일부에 적용합니다.
  • 폴리라인 태스크는 경계 상자 태스크와 비슷하지만, 폴리라인 태스크에서 라벨 지정자는 라벨을 선택하고 폴리라인을 그려 라벨을 이미지의 일부에 적용합니다. 폴리라인은 선 세그먼트로 끝과 끝을 연결해주는 점 2개 이상의 목록으로 구성됩니다.
  • 분류 태스크에서는 라벨러가 각 라벨에 마스크를 생성합니다. 출력은 라벨과 색상을 매핑하는 색상 매핑 테이블입니다.

이미지 분류 태스크

웹 UI

  1. 데이터 라벨링 서비스 UI를 엽니다.

  2. 왼쪽 탐색 메뉴에서 데이터 세트를 선택합니다.

    데이터 세트 페이지에는 현재 프로젝트에 사용할 수 있는 이전에 작성한 데이터 세트의 상태가 표시됩니다.

  3. 라벨 지정을 위해 제출할 데이터 세트의 이름을 클릭합니다.

    상태가 가져오기 완료인 데이터 세트를 제출할 수 있습니다. 데이터 유형 열에서는 데이터 세트에 이미지, 동영상 또는 텍스트가 포함되어 있는지 여부를 확인할 수 있습니다.

  4. 데이터 세트 세부정보 페이지에서 제목 표시줄의 라벨 지정 태스크 만들기 버튼을 클릭합니다.

  5. 새 라벨 지정 태스크 페이지에서 주석을 단 데이터 세트의 이름과 설명을 입력합니다.

    주석 달린 데이터 세트는 수동 라벨 지정자가 라벨을 지정한 후의 데이터 세트 버전입니다.

  6. 목표 드롭다운에서 이 데이터 세트에 대해 수행할 라벨 지정 태스크 유형을 선택합니다.

    드롭다운 목록에는 이 데이터 세트에 있는 데이터 유형에서 지원하는 목표만 표시됩니다. 원하는 목표가 표시되지 않는다면 엉뚱한 데이터 유형이 있는 데이터 세트를 선택했을 가능성이 큽니다. 새 라벨 지정 태스크 페이지를 닫고 다른 데이터 세트를 선택하세요.

  7. 라벨 세트 드롭다운에서 라벨러가 이 세트에 있는 데이터 항목을 적용할 라벨 세트를 선택합니다.

    드롭다운 목록에 이 프로젝트와 관련된 모든 라벨 세트가 포함됩니다. 라벨 세트를 선택해야 합니다.

  8. 안내 드롭다운에서 이 데이터 세트를 작업 중인 라벨 지정자에게 제공할 안내를 선택합니다.

    드롭다운 목록에 이 프로젝트와 관련된 모든 안내가 포함됩니다. 라벨 지정 요청에 안내를 포함해야 합니다.

  9. 데이터 항목별 라벨 지정자 드롭다운에서 데이터 세트의 각 항목을 검토할 라벨 지정자 수를 지정합니다.

    기본값은 1명이지만, 각 항목에 라벨러를 3명이나 5명 요청할 수도 있습니다.

  10. 체크박스를 클릭하여 라벨 지정에 요금이 어떻게 청구되는지 이해했음을 확인합니다.

  11. 만들기를 클릭합니다.

명령줄

다음 환경 변수를 설정합니다.
  1. PROJECT_ID 변수를 Google Cloud 프로젝트 ID로 설정합니다.
  2. DATASET_ID 변수를 데이터 세트를 만들 때 작성한 응답의 데이터 세트 ID로 설정합니다. ID는 데이터 세트 전체 이름 끝에 표시됩니다.

    projects/PROJECT_ID/locations/us-central1/datasets/DATASET_ID
  3. INSTRUCTION_RESOURCE_NAME안내 리소스의 이름으로 설정합니다.
  4. ANNOTATION_SPEC_SET_RESOURCE_NAME라벨 세트 리소스 이름으로 설정합니다.
curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
  -H "Content-Type: application/json" \
  https://datalabeling.googleapis.com/v1beta1/projects/${PROJECT_ID}/datasets/${DATASET_ID}/image:label \
  -d '{
  "basicConfig": {
    "instruction": "${INSTRUCTION_RESOURCE_NAME}",
    "annotatedDatasetDisplayName": "curl_testing_annotated_dataset",
    "labelGroup": "test_label_group",
    "replica_count": 1
  },
  "feature": "TEXT_CLASSIFICATION",
  "imageClassificationConfig": {
    "annotationSpecSet": "${ANNOTATION_SPEC_SET_RESOURCE_NAME}",
  },
}'

다음과 비슷한 출력이 표시됩니다. 작업 ID를 사용하여 작업 상태를 가져올 수 있습니다. 예시는 작업 상태 가져오기를 참조하세요.

{
  "name": "projects/data-labeling-codelab/operations/5c73dd6b_0000_2b34_a920_883d24fa2064",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.data-labeling.v1beta1.LabelImageClassificationOperationMetadata",
    "dataset": "projects/data-labeling-codelab/datasets/5c73db3d_0000_23e0_a25b_94eb2c119c4c"
  }
}

Python

이 코드 예시를 실행하려면 우선 Python 클라이언트 라이브러리를 설치해야 합니다.

def label_image(
    dataset_resource_name, instruction_resource_name, annotation_spec_set_resource_name
):
    """Labels an image dataset."""
    from google.cloud import datalabeling_v1beta1 as datalabeling

    client = datalabeling.DataLabelingServiceClient()

    basic_config = datalabeling.HumanAnnotationConfig(
        instruction=instruction_resource_name,
        annotated_dataset_display_name="YOUR_ANNOTATED_DATASET_DISPLAY_NAME",
        label_group="YOUR_LABEL_GROUP",
        replica_count=1,
    )

    feature = datalabeling.LabelImageRequest.Feature.CLASSIFICATION

    # annotation_spec_set_resource_name needs to be created beforehand.
    # See the examples in the following:
    # https://cloud.google.com/ai-platform/data-labeling/docs/label-sets
    config = datalabeling.ImageClassificationConfig(
        annotation_spec_set=annotation_spec_set_resource_name,
        allow_multi_label=False,
        answer_aggregation_type=datalabeling.StringAggregationType.MAJORITY_VOTE,
    )

    response = client.label_image(
        request={
            "parent": dataset_resource_name,
            "basic_config": basic_config,
            "feature": feature,
            "image_classification_config": config,
        }
    )

    print(f"Label_image operation name: {response.operation.name}")
    return response

Java

이 코드 예시를 실행하려면 우선 자바 클라이언트 라이브러리를 설치해야 합니다.
import com.google.api.gax.longrunning.OperationFuture;
import com.google.cloud.datalabeling.v1beta1.AnnotatedDataset;
import com.google.cloud.datalabeling.v1beta1.DataLabelingServiceClient;
import com.google.cloud.datalabeling.v1beta1.DataLabelingServiceSettings;
import com.google.cloud.datalabeling.v1beta1.HumanAnnotationConfig;
import com.google.cloud.datalabeling.v1beta1.ImageClassificationConfig;
import com.google.cloud.datalabeling.v1beta1.LabelImageRequest;
import com.google.cloud.datalabeling.v1beta1.LabelImageRequest.Feature;
import com.google.cloud.datalabeling.v1beta1.LabelOperationMetadata;
import com.google.cloud.datalabeling.v1beta1.StringAggregationType;
import java.io.IOException;
import java.util.concurrent.ExecutionException;

class LabelImage {

  // Start an Image Labeling Task
  static void labelImage(
      String formattedInstructionName,
      String formattedAnnotationSpecSetName,
      String formattedDatasetName)
      throws IOException {
    // String formattedInstructionName = DataLabelingServiceClient.formatInstructionName(
    //      "YOUR_PROJECT_ID", "YOUR_INSTRUCTION_UUID");
    // String formattedAnnotationSpecSetName =
    //     DataLabelingServiceClient.formatAnnotationSpecSetName(
    //         "YOUR_PROJECT_ID", "YOUR_ANNOTATION_SPEC_SET_UUID");
    // String formattedDatasetName = DataLabelingServiceClient.formatDatasetName(
    //      "YOUR_PROJECT_ID", "YOUR_DATASET_UUID");

    DataLabelingServiceSettings settings =
        DataLabelingServiceSettings.newBuilder()
            .build();
    try (DataLabelingServiceClient dataLabelingServiceClient =
        DataLabelingServiceClient.create(settings)) {
      HumanAnnotationConfig humanAnnotationConfig =
          HumanAnnotationConfig.newBuilder()
              .setAnnotatedDatasetDisplayName("annotated_displayname")
              .setAnnotatedDatasetDescription("annotated_description")
              .setInstruction(formattedInstructionName)
              .build();

      ImageClassificationConfig imageClassificationConfig =
          ImageClassificationConfig.newBuilder()
              .setAllowMultiLabel(true)
              .setAnswerAggregationType(StringAggregationType.MAJORITY_VOTE)
              .setAnnotationSpecSet(formattedAnnotationSpecSetName)
              .build();

      LabelImageRequest labelImageRequest =
          LabelImageRequest.newBuilder()
              .setParent(formattedDatasetName)
              .setBasicConfig(humanAnnotationConfig)
              .setImageClassificationConfig(imageClassificationConfig)
              .setFeature(Feature.CLASSIFICATION)
              .build();

      OperationFuture<AnnotatedDataset, LabelOperationMetadata> operation =
          dataLabelingServiceClient.labelImageAsync(labelImageRequest);

      // You'll want to save this for later to retrieve your completed operation.
      System.out.format("Operation Name: %s\n", operation.getName());

      // Cancel the operation to avoid charges when testing.
      dataLabelingServiceClient.getOperationsClient().cancelOperation(operation.getName());

    } catch (IOException | InterruptedException | ExecutionException e) {
      e.printStackTrace();
    }
  }
}

경계 상자

웹 UI

  1. 데이터 라벨링 서비스 UI를 엽니다.

  2. 왼쪽 탐색 메뉴에서 데이터 세트를 선택합니다.

    데이터 세트 페이지에는 현재 프로젝트에 사용할 수 있는 이전에 작성한 데이터 세트의 상태가 표시됩니다.

  3. 라벨 지정을 위해 제출할 데이터 세트의 이름을 클릭합니다.

    상태가 가져오기 완료인 데이터 세트를 제출할 수 있습니다. 데이터 유형 열에서는 데이터 세트에 이미지, 동영상 또는 텍스트가 포함되어 있는지 여부를 확인할 수 있습니다.

  4. 데이터 세트 세부정보 페이지에서 제목 표시줄의 라벨 지정 태스크 만들기 버튼을 클릭합니다.

  5. 새 라벨 지정 태스크 페이지에서 주석을 단 데이터 세트의 이름과 설명을 입력합니다.

    주석 달린 데이터 세트는 수동 라벨 지정자가 라벨을 지정한 후의 데이터 세트 버전입니다.

  6. 목표 드롭다운에서 이 데이터 세트에 대해 수행할 라벨 지정 태스크 유형을 선택합니다.

    드롭다운 목록에는 이 데이터 세트에 있는 데이터 유형에서 지원하는 목표만 표시됩니다. 원하는 목표가 표시되지 않는다면 엉뚱한 데이터 유형이 있는 데이터 세트를 선택했을 가능성이 큽니다. 새 라벨 지정 태스크 페이지를 닫고 다른 데이터 세트를 선택하세요.

  7. 라벨 세트 드롭다운에서 라벨러가 이 세트에 있는 데이터 항목을 적용할 라벨 세트를 선택합니다.

    드롭다운 목록에 이 프로젝트와 관련된 모든 라벨 세트가 포함됩니다. 라벨 세트를 선택해야 합니다.

  8. 안내 드롭다운에서 이 데이터 세트를 작업 중인 라벨 지정자에게 제공할 안내를 선택합니다.

    드롭다운 목록에 이 프로젝트와 관련된 모든 안내가 포함됩니다. 라벨 지정 요청에 안내를 포함해야 합니다.

  9. 데이터 항목별 라벨 지정자 드롭다운에서 데이터 세트의 각 항목을 검토할 라벨 지정자 수를 지정합니다.

    기본값은 1명이지만, 각 항목에 라벨러를 3명이나 5명 요청할 수도 있습니다.

  10. 체크박스를 클릭하여 라벨 지정에 요금이 어떻게 청구되는지 이해했음을 확인합니다.

  11. 만들기를 클릭합니다.

명령줄

다음 환경 변수를 설정합니다.
  1. PROJECT_ID 변수를 Google Cloud 프로젝트 ID로 설정합니다.
  2. DATASET_ID 변수를 데이터 세트를 만들 때 작성한 응답의 데이터 세트 ID로 설정합니다. ID는 데이터 세트 전체 이름 끝에 표시됩니다.

    projects/PROJECT_ID/locations/us-central1/datasets/DATASET_ID
  3. INSTRUCTION_RESOURCE_NAME안내 리소스의 이름으로 설정합니다.
  4. ANNOTATION_SPEC_SET_RESOURCE_NAME라벨 세트 리소스 이름으로 설정합니다.
curl -X POST \
  -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
  -H "Content-Type: application/json" \
  https://datalabeling.googleapis.com/v1beta1/projects/${PROJECT_ID}/datasets/${DATASET_ID}/image:label \
  -d '{
  "basicConfig": {
    "instruction": "${INSTRUCTION_RESOURCE_NAME}",
    "annotatedDatasetDisplayName": "curl_testing_annotated_dataset",
    "labelGroup": "test_label_group",
    "replica_count": 1
  },
  "feature": "BOUNDING_BOX",
  "boundingPolyConfig": {
    "annotationSpecSet": "${ANNOTATION_SPEC_SET_RESOURCE_NAME}",
  },
}'

다음과 비슷한 출력이 표시됩니다. 작업 ID를 사용하여 작업 상태를 가져올 수 있습니다. 예시는 작업 상태 가져오기를 참조하세요.

{
  "name": "projects/data-labeling-codelab/operations/5c73dd6b_0000_2b34_a920_883d24fa2064",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.data-labeling.v1beta1.LabelImageBoundingBoxOperationMetadata",
    "dataset": "projects/data-labeling-codelab/datasets/5c73db3d_0000_23e0_a25b_94eb2c119c4c"
  }
}