Analiza los videos para encontrar etiquetas

La API de Video Intelligence puede identificar entidades que se muestran en videos mediante la función LABEL_DETECTION y anotarlas con etiquetas. Esta característica identifica objetos, ubicaciones, actividades, especies de animales, productos y mucho más.

La detección de etiquetas difiere del seguimiento de objetos. A diferencia del seguimiento de objetos, la detección de etiquetas proporciona etiquetas para todo el marco (sin cuadros de límite).

Por ejemplo, para un video de un tren en un cruce, la API de Video Intelligence muestra etiquetas como “tren”, “transporte”, “cruce ferroviario”, etcétera. Cada etiqueta incluye un segmento con la compensación horaria (marca de tiempo) para que la entidad aparezca desde el principio del video. Cada anotación también contiene información adicional, incluido un ID de entidad que puedes usar para encontrar más información sobre la entidad en la API de Búsqueda en el Gráfico de conocimiento de Google.

Cada entidad que se muestra también puede incluir entidades de categoría asociadas en el campo categoryEntities. Por ejemplo, la etiqueta de la entidad "Terrier" tiene una categoría de "Perro". Las entidades de categoría tienen una jerarquía. Por ejemplo, la categoría “Perro” es una secundaria de la categoría “Mammal” en la jerarquía. Para obtener una lista de las entidades de categoría comunes que usa Video Intelligence, consulta entry-level-categories.json.

El análisis se puede compartimentar de la siguiente manera:

  • Nivel de segmento:
    Los segmentos seleccionados por el usuario de un video se pueden especificar para analizarlos si se determinan las marcas de tiempo de inicio y finalización para los fines de la anotación (consulta VideoSegment). Luego, las entidades se identifican y etiquetan dentro de cada segmento. Si no se especifican segmentos, todo el video se trata como un solo segmento.

  • Nivel de toma:
    Las tomas (también conocidas como escenas) se detectan de forma automática en cada segmento (o video). Luego, las entidades se identifican y se etiquetan dentro de cada escena. Para obtener más información, consulta Detección de cambio de plano.
  • Nivel de marco:
    se identifican y etiquetan dentro de cada marco (con un fotograma por segundo).

Para detectar etiquetas en un video, llama a la funciónannotate y especificaLABEL_DETECTION en lafeatures.

Consulta los instructivos Analiza videos para etiquetas y Detección de etiquetas.

Visualizador de la API de Video Intelligence

Consulta el visualizador de la API de Video Intelligence para ver esta función en acción.