Video Intelligence API는 LABEL_DETECTION 기능을 사용하여 동영상에 표시된 항목을 식별하고 라벨(태그)을 사용하여 이러한 항목에 주석을 작성할 수 있습니다. 이 기능은 객체, 위치, 활동, 동물 종, 제품 등을 식별합니다.
라벨 인식은 객체 추적과 다릅니다. 객체 추적과 달리 라벨 인식은 경계 상자 없이 전체 프레임에 대한 라벨을 제공합니다.
예를 들어 건널목에 있는 열차 동영상의 경우 Video Intelligence API가 '열차', '운송', '철도 건널목' 등과 같은 라벨을 반환합니다. 각 라벨에는 개체가 등장하는 시간을 동영상의 시작 부분으로 하여, 시간 오프셋(타임스탬프)을 나타내는 시간 세그먼트가 포함됩니다. 또한 각 주석에는 Google Knowledge Graph Search API에서 개체에 대한 추가 정보를 검색하는 데 사용할 수 있는 개체 ID와 같은 추가 개체 정보가 포함되어 있습니다.
반환된 각 개체는 categoryEntities
필드에 연결된 카테고리 개체를 포함할 수도 있습니다. 예를 들어 'Terrier' 항목 라벨은 'Dog' 카테고리를 갖습니다. 카테고리 개체에는 계층 구조가 있습니다. 예를 들어 'Dog' 카테고리는 계층 구조에서 'Mammal' 카테고리의 하위 항목입니다. Video Intelligence가 사용하는 일반적인 카테고리 개체 목록은 entry-level-categories.json을 참조하세요.
분석을 다음과 같이 구획화할 수 있습니다.
- 세그먼트 수준:
주석 목적에 따라 시작 및 종료 타임스탬프를 규정하여 사용자가 선택한 동영상 세그먼트를 분석하도록 지정할 수 있습니다(VideoSegment 참조). 그런 후 항목이 식별되고 각 세그먼트 내에서 라벨로 지정됩니다. 세그먼트를 지정하지 않으면 전체 동영상이 하나의 세그먼트로 취급됩니다. - 장면 수준:
장면(장면(scene)이라고도 부름)이 모든 세그먼트(또는 동영상) 내에서 자동으로 감지됩니다. 그런 후 항목이 식별되고 각 장면 내에서 라벨로 지정됩니다. 자세한 내용은 장면 변화 감지를 참조하세요. - 프레임 수준:
각 프레임 내에서 항목이 식별되고 라벨로 지정됩니다(초당 1프레임 샘플링).
동영상의 라벨을 감지하려면 annotate
메서드를 호출하고 LABEL_DETECTION
을 features
필드에 지정합니다.
동영상 라벨 분석 및 라벨 인식 튜토리얼을 참조하세요.
Video Intelligence API 시각화
Video Intelligence API 시각화에서 이 기능의 사용 사례를 참조하세요.