Se usó la API de Cloud Translation para traducir esta página.
Switch to English

Analiza videos para etiquetas

La API de Video Intelligence puede identificar entidades mostradas en el video con la función LABEL_DETECTION y anotar estas entidades con etiquetas (etiquetas). Esta característica identifica objetos, ubicaciones, actividades, especies animales, productos y mucho más.

La detección de etiquetas es diferente del seguimiento de objetos. A diferencia del seguimiento de objetos, la detección de etiquetas proporciona etiquetas para todo el marco (sin cuadros de límite).

Por ejemplo, para un video de un tren en un cruce, la API de Video Intelligence muestra etiquetas como “train”, “transporte”, “ crucee de tren”, etcétera. Cada etiqueta incluye un segmento de tiempo con la compensación horaria (marca de tiempo) para la apariencia de la entidad desde el comienzo del video. Cada anotación también contiene información adicional, incluido un ID de entidad, que puedes usar para encontrar más información sobre la entidad en la API de búsqueda del Gráfico de conocimiento de Google.

Cada entidad que se muestra también puede incluir entidades de categorías asociadas en el campo categoryEntities. Por ejemplo, la etiqueta de entidad "Terier" tiene una categoría "Dog". Las entidades de categoría tienen una jerarquía. Por ejemplo, la categoría "Dog" es un elemento secundario de la categoría "Mamal" en la jerarquía. Para obtener una lista de las entidades de categoría comunes que usa Video Intelligence, consulta entry-level-categories.json.

El análisis se puede compartimentar de la siguiente manera:

  • Nivel de segmento:
    Los segmentos seleccionados por el usuario de un video se pueden especificar para analizarlos si se determinan las marcas de tiempo de inicio y finalización para los fines de la anotación (consulta VideoSegment). Luego, las entidades se identifican y etiquetan dentro de cada segmento. Si no se especifican segmentos, todo el video se trata como un solo segmento.

  • Nivel de toma: Las tomas
    (también conocidas como escenas) se detectan automáticamente en cada segmento (o video). Luego, las entidades se identifican y se etiquetan dentro de cada escena. Para obtener más información, consulta Detección de cambios de calzado
  • Nivel de marco:
    se identifican y etiquetan dentro de cada marco (con un fotograma por segundo).

Para detectar etiquetas en un video, llama al método annotate y especifica LABEL_DETECTION en el features.

Para ver ejemplos, consulta Analiza videos para etiquetas y el Instructivo de detección de etiquetas.