AI Platform Data Labeling Service

AI Platform Data Labeling Service를 사용하면 커스텀 머신러닝 모델을 학습시키는 데 사용할 데이터 모음에 대한 수동 라벨 지정을 요청할 수 있습니다.

머신러닝 모델을 학습시키려면 분류하거나 분석할 콘텐츠 유형의 대표 샘플과, 모델이 각 샘플을 처리하는 '올바른 방법'을 제공해야 합니다. 예를 들어 꽃 이미지를 분류하는 모델을 학습시키려면 꽃의 유형(해바라기, 데이지, 장미, 튤립)을 라벨로 지정한 이미지 샘플 모음을 제공해야 합니다. 의료 문서에서 병명을 식별하는 모델을 학습시키려면 질병을 강조 처리한 샘플 문서를 제공해야 합니다. 모델은 샘플을 바탕으로 추정하는 방법을 배웁니다.

Data Labeling Service를 사용하면 대표 샘플을 수동 라벨 지정자에게 제출할 수 있습니다. 수동 라벨 지정자는 샘플에 '정답'을 주석으로 달고 머신러닝 모델 교육에 적합한 형식으로 데이터세트를 반환합니다. 제공하는 샘플 데이터 유형과 수동 라벨 지정자가 추가하는 주석의 유형은 학습시킬 머신러닝 유형에 따라 달라집니다.

데이터 라벨 지정을 요청하려면 수동 라벨 지정자를 위해 리소스 3개를 만들어야 합니다.

  • 라벨 지정자가 라벨을 지정할 대표 샘플이 있는 데이터세트
  • 라벨 지정자가 데이터세트의 항목에 적용할 라벨을 식별하는 주석 사양 모음
  • 라벨을 데이터에 적용하는 방법을 알려주는 라벨 지정자용 안내 모음

3가지 리소스를 만들었다면 라벨 지정 요청을 할 때 이러한 리소스를 제출해야 합니다. 수동 라벨 지정자는 사용자의 안내에 따라 데이터세트 항목에 주석을 달고, 주석 달린 데이터세트를 반환합니다. 사용자는 이 데이터세트를 내보내고 커스텀 머신러닝 모델의 학습 데이터로 사용할 수 있습니다.