동영상 동작 인식 모델의 예측 결과 해석

Vertex AI는 예측을 요청한 후 모델의 목표에 따라 결과를 반환합니다. 동작 인식 모델의 예측은 직접 정의한 라벨에 따라 동작 시점을 반환합니다. 모델이 각 예측에 신뢰도 점수를 할당하면 모델이 동작을 정확히 얼마나 확실하게 식별했는지 알 수 있습니다. 숫자가 클수록 모델의 예측 정확성에 대한 신뢰도가 높아집니다.

일괄 예측 출력 예시

다음 샘플은 동영상에서 '스윙' 및 '점프' 작업을 식별하는 모델의 예측 결과입니다. 각 결과에는 식별된 작업의 라벨('스윙' 또는 '점프'), 동작 시점을 지정하는 시작 시간 및 종료 시간이 동일한 시간 세그먼트, 신뢰도 점수가 포함됩니다.

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "swing",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "1.2s",
    "confidence": 0.7
  }, {
    "id": "2",
    "displayName": "jump",
    "timeSegmentStart": "3.4s",
    "timeSegmentEnd": "3.4s",
    "confidence": 0.5
  }]
}