Analizza i video per individuare le etichette

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

L'API Video Intelligence può identificare le entità mostrate nei filmati utilizzando la funzionalità LABEL_DETECTION e annotare tali entità con le etichette (tag). Questa funzionalità identifica oggetti, località, attività, specie animali, prodotti e altro ancora.

Il rilevamento delle etichette è diverso dal Monitoraggio oggetti. A differenza del monitoraggio di oggetti, il rilevamento delle etichette fornisce etichette per l'intero frame (senza riquadri di delimitazione).

Ad esempio, per il video di un treno che attraversa un incrocio, l'API Video Intelligence restituisce etichette quali "treno". Ogni etichetta include un segmento temporale con la differenza di tempo (timestamp) relativa all'aspetto dell'entità a partire dall'inizio del video. Ogni annotazione contiene anche informazioni aggiuntive, tra cui un ID entità che puoi utilizzare per trovare ulteriori informazioni sull'entità in l'API Google Knowledge Graph.

Ogni entità restituita può anche includere entità di categoria associate nel campo categoryEntities. Ad esempio, l'etichetta entità "Terrier" ha una categoria "Cane". Le entità delle categorie hanno una gerarchia. Ad esempio, la categoria "Cane" è un figlio della categoria "Mammale" nella gerarchia. Per un elenco delle entità delle categorie comuni utilizzate da Video Intelligence, consulta entry-level-categories.json.

L'analisi può essere compartimentata come segue:

  • A livello di segmento:
    i segmenti selezionati da un video possono essere specificati per l'analisi impostando timestamp di inizio e fine ai fini dell'annotazione (vedi Segmento video). Le entità vengono quindi identificate ed etichettate all'interno di ogni segmento. Se non vengono specificati segmenti, l'intero video viene considerato come un unico segmento.

  • A livello di scatto:
    scatti (noti anche come scene) vengono rilevati automaticamente all'interno di ogni segmento (o video). Le entità vengono quindi identificate ed etichettate all'interno di ogni scena. Per maggiori dettagli, consulta la sezione Rilevamento del cambio di inquadratura.
  • A livello di frame:
    le entità vengono identificate ed etichettate all'interno di ogni frame (con campionamento di un frame al secondo).

Per rilevare le etichette in un video, chiama il metodo annotate e specifica LABEL_DETECTION nel campo features.

Consulta le sezioni Analisi dei video per le etichette e Tutorial sul rilevamento delle etichette.

Video Intelligence API Visualizer

Controlla il visualizzatore dell'API Video Intelligence per vedere questa funzionalità in azione.