Analizar videos en función de las etiquetas

Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

La API de Video Intelligence puede identificar entidades que se muestran en videos con la característica LABEL_DETECTION y anotar estas entidades con etiquetas (etiquetas). Esta función identifica objetos, ubicaciones, actividades, especies de animales, productos y mucho más.

La detección de etiquetas difiere del seguimiento de objetos. A diferencia del seguimiento de objetos, la detección de etiquetas proporciona etiquetas para todo el fotograma (sin cuadros de límite).

Por ejemplo, para un video de un tren en un cruce, la API de Video Intelligence muestra etiquetas como "trailar" &transtation;transportation", &railroad crossing, etc. Cada etiqueta incluye un segmento temporal con la compensación horaria (marca de tiempo) para la apariencia de la entidad desde el comienzo del video. Cada anotación también contiene información adicional, incluido un ID de entidad que puedes usar para encontrar más información sobre la entidad en la API de Google Knowledge Graph Search.

Cada entidad mostrada también puede incluir entidades de categoría asociadas en el campo categoryEntities. Por ejemplo, la etiqueta de entidad “Terrier” tiene una categoría de “Perro”. Las entidades de categoría tienen una jerarquía. Por ejemplo, la categoría "Perro" es una secundaria de la categoría "Mammal" en la jerarquía. Para obtener una lista de las entidades de categoría comunes que usa Video Intelligence, consulta entry-level-categories.json.

El análisis se puede compartimentar de la siguiente manera:

  • Nivel de segmento:
    Los segmentos seleccionados por el usuario de un video se pueden especificar para analizarlos si se determinan las marcas de tiempo de inicio y finalización para los fines de la anotación (consulta VideoSegment). Luego, las entidades se identifican y etiquetan dentro de cada segmento. Si no se especifican segmentos, todo el video se trata como un solo segmento.

  • Nivel de toma:
    Los fotogramas (también conocidos como escenas) se detectan automáticamente en cada segmento (o video). Luego, las entidades se identifican y etiquetan en cada escena. Si deseas obtener más detalles, consulta Detección de cambios de tomas.
  • Nivel de fotogramas:
    Se identifican y etiquetan entidades dentro de cada marco (con un muestreo de segundo por segundo).

Para detectar etiquetas en un video, llama al método annotate y especifica LABEL_DETECTION en el campo features.

Consulta Analiza videos en función de etiquetas y Instructivo de detección de etiquetas.

Visualizador de API de Video Intelligence

Si quieres ver esta función en acción, consulta el visualizador de la API de Video Intelligence.