Analizzare i video per individuare le etichette

L'API Video Intelligence può identificare le entità mostrate nei filmati utilizzando la funzionalità LABEL_DETECTION e annotare queste entità con etichette (tag). Questa funzionalità identifica oggetti, luoghi, attività, specie animali, prodotti e altro ancora.

Il rilevamento etichette è diverso dal monitoraggio degli oggetti. A differenza del monitoraggio degli oggetti, il rilevamento etichette fornisce etichette per l'intero frame (senza riquadri di delimitazione).

Ad esempio, per un video di un treno a un incrocio, l'API Video Intelligence restituisce etichette come "treno", "trasporto", "passaggio a livello" e così via. Ogni etichetta include un segmento di tempo con il offset temporale (offset) relativo all'aspetto dell'entità dall'inizio del video. Ogni annotazione contiene anche informazioni aggiuntive, tra cui un ID entità che puoi utilizzare per trovare ulteriori informazioni sull'entità nell'API Google Knowledge Graph Search.

Ogni entità restituita può includere anche entità di categoria associate nel campo categoryEntities. Ad esempio, l'etichetta dell'entità "Terrier" ha la categoria "Cane". Le entità di categoria hanno una gerarchia. Ad esempio, la categoria "Cane" è un elemento secondario della categoria "Mammifero" nella gerarchia. Per un elenco delle entità delle categorie comuni utilizzate da Video Intelligence, consulta entry-level-categories.json.

L'analisi può essere compartimentata come segue:

Livello di segmento:
i segmenti di un video selezionati dall'utente possono essere specificati a scopo di analisi definendo i timestamp di inizio e fine ai fini dell'annotazione (consulta la sezione VideoSegment). Le entità vengono quindi identificate ed etichettate all'interno di ciascun segmento. Se non vengono specificati segmenti, l'intero video viene considerato come un singolo segmento.
A livello di ripresa:
gli scatti (chiamati anche scena) vengono rilevati automaticamente all'interno di ogni segmento (o video). Le entità vengono quindi identificate ed etichettate all'interno di ogni scena. Per maggiori dettagli, vedi Rilevamento cambio di inquadratura
A livello di frame:
le entità sono identificate ed etichettate all'interno di ogni frame (con un campionamento di un frame al secondo).

Per rilevare le etichette in un video, chiama il metodo annotate e specifica LABEL_DETECTION nel campo features.

Consulta Analisi dei video per le etichette e Tutorial sul rilevamento delle etichette.

Visualizzatore API Video Intelligence

Dai un'occhiata al visualizzatore dell'API Video Intelligence per vedere questa funzionalità in azione.