AI Platform 데이터 라벨링 서비스에서는 6가지 유형의 이미지 라벨링 작업을 지원합니다.
- 분류에서는 라벨러가 각 이미지에 하나 이상의 라벨을 지정합니다.
- 경계 상자에서는 라벨러가 라벨을 선택하고 경계 상자를 하나 이상 그려 라벨을 이미지의 일부에 적용합니다.
- 방향 지정 경계 상자 태스크는 경계 상자 태스크와 비슷하지만, 경계 상자는 x축으로 정렬되는 반면 방향 지정 경계 상자는 방향이 제한되지 않습니다.
- 경계 다각형은 경계 상자와 비슷하지만, 경계 다각형에서 라벨러는 라벨을 선택하고 닫힌 다각형을 그려 라벨을 이미지의 일부에 적용합니다.
- 폴리라인 태스크는 경계 상자 태스크와 비슷하지만, 폴리라인 태스크에서 라벨 지정자는 라벨을 선택하고 폴리라인을 그려 라벨을 이미지의 일부에 적용합니다. 폴리라인은 선 세그먼트로 끝과 끝을 연결해주는 점 2개 이상의 목록으로 구성됩니다.
- 분류 태스크에서는 라벨러가 각 라벨에 마스크를 생성합니다. 출력은 라벨과 색상을 매핑하는 색상 매핑 테이블입니다.
이미지 분류 태스크
웹 UI
데이터 라벨링 서비스 UI를 엽니다.
왼쪽 탐색 메뉴에서 데이터 세트를 선택합니다.
데이터 세트 페이지에는 현재 프로젝트에 사용할 수 있는 이전에 작성한 데이터 세트의 상태가 표시됩니다.
라벨 지정을 위해 제출할 데이터 세트의 이름을 클릭합니다.
상태가 가져오기 완료인 데이터 세트를 제출할 수 있습니다. 데이터 유형 열에서는 데이터 세트에 이미지, 동영상 또는 텍스트가 포함되어 있는지 여부를 확인할 수 있습니다.
데이터 세트 세부정보 페이지에서 제목 표시줄의 라벨 지정 태스크 만들기 버튼을 클릭합니다.
새 라벨 지정 태스크 페이지에서 주석을 단 데이터 세트의 이름과 설명을 입력합니다.
주석 달린 데이터 세트는 수동 라벨 지정자가 라벨을 지정한 후의 데이터 세트 버전입니다.
목표 드롭다운에서 이 데이터 세트에 대해 수행할 라벨 지정 태스크 유형을 선택합니다.
드롭다운 목록에는 이 데이터 세트에 있는 데이터 유형에서 지원하는 목표만 표시됩니다. 원하는 목표가 표시되지 않는다면 엉뚱한 데이터 유형이 있는 데이터 세트를 선택했을 가능성이 큽니다. 새 라벨 지정 태스크 페이지를 닫고 다른 데이터 세트를 선택하세요.
라벨 세트 드롭다운에서 라벨러가 이 세트에 있는 데이터 항목을 적용할 라벨 세트를 선택합니다.
드롭다운 목록에 이 프로젝트와 관련된 모든 라벨 세트가 포함됩니다. 라벨 세트를 선택해야 합니다.
안내 드롭다운에서 이 데이터 세트를 작업 중인 라벨 지정자에게 제공할 안내를 선택합니다.
드롭다운 목록에 이 프로젝트와 관련된 모든 안내가 포함됩니다. 라벨 지정 요청에 안내를 포함해야 합니다.
데이터 항목별 라벨 지정자 드롭다운에서 데이터 세트의 각 항목을 검토할 라벨 지정자 수를 지정합니다.
기본값은 1명이지만, 각 항목에 라벨러를 3명이나 5명 요청할 수도 있습니다.
체크박스를 클릭하여 라벨 지정에 요금이 어떻게 청구되는지 이해했음을 확인합니다.
만들기를 클릭합니다.
명령줄
다음 환경 변수를 설정합니다.PROJECT_ID
변수를 Google Cloud 프로젝트 ID로 설정합니다.-
DATASET_ID
변수를 데이터 세트를 만들 때 작성한 응답의 데이터 세트 ID로 설정합니다. ID는 데이터 세트 전체 이름 끝에 표시됩니다.projects/PROJECT_ID/locations/us-central1/datasets/DATASET_ID
INSTRUCTION_RESOURCE_NAME
을 안내 리소스의 이름으로 설정합니다.ANNOTATION_SPEC_SET_RESOURCE_NAME
을 라벨 세트 리소스 이름으로 설정합니다.
curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ https://datalabeling.googleapis.com/v1beta1/projects/${PROJECT_ID}/datasets/${DATASET_ID}/image:label \ -d '{ "basicConfig": { "instruction": "${INSTRUCTION_RESOURCE_NAME}", "annotatedDatasetDisplayName": "curl_testing_annotated_dataset", "labelGroup": "test_label_group", "replica_count": 1 }, "feature": "TEXT_CLASSIFICATION", "imageClassificationConfig": { "annotationSpecSet": "${ANNOTATION_SPEC_SET_RESOURCE_NAME}", }, }'
다음과 비슷한 출력이 표시됩니다. 작업 ID를 사용하여 작업 상태를 가져올 수 있습니다. 예시는 작업 상태 가져오기를 참조하세요.
{ "name": "projects/data-labeling-codelab/operations/5c73dd6b_0000_2b34_a920_883d24fa2064", "metadata": { "@type": "type.googleapis.com/google.cloud.data-labeling.v1beta1.LabelImageClassificationOperationMetadata", "dataset": "projects/data-labeling-codelab/datasets/5c73db3d_0000_23e0_a25b_94eb2c119c4c" } }
Python
이 코드 예시를 실행하려면 우선 Python 클라이언트 라이브러리를 설치해야 합니다.Java
이 코드 예시를 실행하려면 우선 자바 클라이언트 라이브러리를 설치해야 합니다.경계 상자
웹 UI
데이터 라벨링 서비스 UI를 엽니다.
왼쪽 탐색 메뉴에서 데이터 세트를 선택합니다.
데이터 세트 페이지에는 현재 프로젝트에 사용할 수 있는 이전에 작성한 데이터 세트의 상태가 표시됩니다.
라벨 지정을 위해 제출할 데이터 세트의 이름을 클릭합니다.
상태가 가져오기 완료인 데이터 세트를 제출할 수 있습니다. 데이터 유형 열에서는 데이터 세트에 이미지, 동영상 또는 텍스트가 포함되어 있는지 여부를 확인할 수 있습니다.
데이터 세트 세부정보 페이지에서 제목 표시줄의 라벨 지정 태스크 만들기 버튼을 클릭합니다.
새 라벨 지정 태스크 페이지에서 주석을 단 데이터 세트의 이름과 설명을 입력합니다.
주석 달린 데이터 세트는 수동 라벨 지정자가 라벨을 지정한 후의 데이터 세트 버전입니다.
목표 드롭다운에서 이 데이터 세트에 대해 수행할 라벨 지정 태스크 유형을 선택합니다.
드롭다운 목록에는 이 데이터 세트에 있는 데이터 유형에서 지원하는 목표만 표시됩니다. 원하는 목표가 표시되지 않는다면 엉뚱한 데이터 유형이 있는 데이터 세트를 선택했을 가능성이 큽니다. 새 라벨 지정 태스크 페이지를 닫고 다른 데이터 세트를 선택하세요.
라벨 세트 드롭다운에서 라벨러가 이 세트에 있는 데이터 항목을 적용할 라벨 세트를 선택합니다.
드롭다운 목록에 이 프로젝트와 관련된 모든 라벨 세트가 포함됩니다. 라벨 세트를 선택해야 합니다.
안내 드롭다운에서 이 데이터 세트를 작업 중인 라벨 지정자에게 제공할 안내를 선택합니다.
드롭다운 목록에 이 프로젝트와 관련된 모든 안내가 포함됩니다. 라벨 지정 요청에 안내를 포함해야 합니다.
데이터 항목별 라벨 지정자 드롭다운에서 데이터 세트의 각 항목을 검토할 라벨 지정자 수를 지정합니다.
기본값은 1명이지만, 각 항목에 라벨러를 3명이나 5명 요청할 수도 있습니다.
체크박스를 클릭하여 라벨 지정에 요금이 어떻게 청구되는지 이해했음을 확인합니다.
만들기를 클릭합니다.
명령줄
다음 환경 변수를 설정합니다.PROJECT_ID
변수를 Google Cloud 프로젝트 ID로 설정합니다.-
DATASET_ID
변수를 데이터 세트를 만들 때 작성한 응답의 데이터 세트 ID로 설정합니다. ID는 데이터 세트 전체 이름 끝에 표시됩니다.projects/PROJECT_ID/locations/us-central1/datasets/DATASET_ID
INSTRUCTION_RESOURCE_NAME
을 안내 리소스의 이름으로 설정합니다.ANNOTATION_SPEC_SET_RESOURCE_NAME
을 라벨 세트 리소스 이름으로 설정합니다.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ https://datalabeling.googleapis.com/v1beta1/projects/${PROJECT_ID}/datasets/${DATASET_ID}/image:label \ -d '{ "basicConfig": { "instruction": "${INSTRUCTION_RESOURCE_NAME}", "annotatedDatasetDisplayName": "curl_testing_annotated_dataset", "labelGroup": "test_label_group", "replica_count": 1 }, "feature": "BOUNDING_BOX", "boundingPolyConfig": { "annotationSpecSet": "${ANNOTATION_SPEC_SET_RESOURCE_NAME}", }, }'
다음과 비슷한 출력이 표시됩니다. 작업 ID를 사용하여 작업 상태를 가져올 수 있습니다. 예시는 작업 상태 가져오기를 참조하세요.
{ "name": "projects/data-labeling-codelab/operations/5c73dd6b_0000_2b34_a920_883d24fa2064", "metadata": { "@type": "type.googleapis.com/google.cloud.data-labeling.v1beta1.LabelImageBoundingBoxOperationMetadata", "dataset": "projects/data-labeling-codelab/datasets/5c73db3d_0000_23e0_a25b_94eb2c119c4c" } }