L'API Video Intelligence può identificare le entità mostrate nei filmati utilizzando la funzionalità LABEL_DETECTION e annotare queste entità con etichette (tag). Questa funzionalità identifica oggetti, località, attività, specie animali, prodotti e altro ancora.
Il rilevamento delle etichette è diverso dal monitoraggio degli oggetti. A differenza del monitoraggio degli oggetti, il rilevamento delle etichette fornisce etichette per l'intero frame (senza riquadri di delimitazione).
Ad esempio, per un video di un treno a un passaggio a livello, l'API Video Intelligence restituisce etichette come "treno", "trasporto", "passaggio a livello" e così via. Ogni etichetta include un segmento di tempo con l'offset temporale (timestamp) per la comparsa dell'entità dall'inizio del video. Ogni annotazione contiene anche informazioni aggiuntive, tra cui un ID entità che puoi utilizzare per trovare ulteriori informazioni sull'entità nell'API di ricerca del Knowledge Graph di Google.
Ogni entità restituita può includere anche le entità di categoria associate nel campo categoryEntities
. Ad esempio,
l'etichetta dell'entità "Terrier" ha una categoria "Cane". Le entità di categoria hanno una gerarchia. Ad esempio, la categoria "Cane" è una categoria secondaria della categoria "Mammifero" nella gerarchia. Per un elenco delle entità di categoria comuni utilizzate da Video Intelligence, consulta entry-level-categories.json.
L'analisi può essere suddivisa come segue:
- A livello di segmento:
i segmenti di un video selezionati dall'utente possono essere specificati per l'analisi specificando i timestamp di inizio e di fine ai fini dell'annotazione (vedi VideoSegment). Le entità vengono quindi identificate ed etichettate all'interno di ciascun segmento. Se non vengono specificati segmenti, l'intero video viene considerato come un unico segmento. - A livello di inquadratura:
le inquadrature (note anche come scene) vengono rilevate automaticamente all'interno di ogni segmento (o video). Le entità vengono quindi identificate ed etichettate all'interno di ogni scena. Per maggiori dettagli, vedi Rilevamento dei cambi di inquadratura - A livello di frame:
le entità vengono identificate ed etichettate all'interno di ogni frame (con un campionamento di un frame al secondo).
Per rilevare le etichette in un video, chiama il metodo
annotate
e specifica
LABEL_DETECTION
nel campo features
.
Consulta Analisi dei video per l'individuazione delle etichette e Tutorial sul rilevamento delle etichette.
Visualizzatore dell'API Video Intelligence
Dai un'occhiata al visualizzatore dell'API Video Intelligence per vedere questa funzionalità in azione.