Questa versione precedente di AutoML Video Intelligence è stata ritirata e non sarà più disponibile su Google Cloud dopo il 23 gennaio 2024. Tutte le funzionalità della versione precedente di AutoML Video Intelligence e le nuove funzionalità sono disponibili sulla piattaforma Vertex AI. Consulta Eseguire la migrazione a Vertex AI per scoprire come eseguire la migrazione delle risorse.

Preparazione dei dati di addestramento

Questa pagina descrive come preparare i dati di addestramento e test in modo che AutoML Video Intelligence Classification possa creare un modello di annotazione video.

Preparazione dei video in corso...

AutoML Video Intelligence Classification supporta i seguenti formati video (mostrati di seguito) per l'addestramento del modello o per la richiesta di una previsione (annotazione di un video). La dimensione massima dei file è 50 GB (fino a 3 ore di durata). Non sono supportati singoli file video con timestamp vuoti o non corretti nel contenitore.
- .MOV
- .MPEG4
- MP4
- File AVI
I dati di addestramento dovrebbero essere il più possibile simili a quelli su cui devono essere fatte le previsioni. Ad esempio, se il tuo caso d'uso prevede video sfocati e a bassa risoluzione (come quelli di una videocamera di sicurezza), i dati di addestramento devono essere composti da video sfocati e a bassa risoluzione. In generale, dovresti anche valutare la possibilità di fornire più angolazioni, risoluzioni e sfondi per i tuoi video di formazione.
In genere, i modelli AutoML Video non sono in grado di prevedere etichette che gli esseri umani non possono assegnare. Quindi, se una persona non può essere addestrata ad assegnare etichette guardando il video per 1-2 secondi, probabilmente anche il modello non può essere addestrato a farlo.
Consigliamo circa 1000 video di addestramento o segmenti video per etichetta. Il minimo per etichetta è 10. In generale, sono necessari più esempi per etichetta per addestrare modelli con più etichette per video e i punteggi risultanti sono più difficili da interpretare.
Il modello funziona meglio quando ci sono al massimo 100 volte più video per l'etichetta più comune rispetto all'etichetta meno comune. Consigliamo di rimuovere le etichette di frequenza molto bassa.
Valuta la possibilità di includere un'etichetta None_of_the_above e video che non corrispondono a nessuna delle etichette che hai definito. Ad esempio, per un set di dati sugli animali, includi video di animali al di fuori delle varietà etichettate e etichettali come None_of_the_above. Questo può migliorare la precisione del modello. Tieni presente che, anche se qualsiasi nome di etichetta funzionerà, None_of_the_above viene trattato in modo speciale dal sistema.

Set di dati per addestramento, convalida e test

Durante l'addestramento di un modello, i dati di un set di dati vengono suddivisi in tre set di dati: un set di dati di addestramento, un set di dati di convalida e un set di dati di test.

Per creare un modello viene utilizzato un set di dati di addestramento. Durante la ricerca di pattern nei dati di addestramento, vengono tentati più algoritmi e parametri.
Man mano che i pattern vengono identificati, il set di dati di convalida viene utilizzato per testare gli algoritmi e i pattern. Gli algoritmi e i pattern con le prestazioni migliori vengono scelti tra quelli identificati durante la fase di addestramento.
Una volta identificati, gli algoritmi e i pattern con le migliori prestazioni, vengono testati per il tasso di errore, la qualità e l'accuratezza utilizzando il set di dati di test.

Vengono utilizzati sia un set di dati di convalida che un set di dati di test per evitare bias nel modello. Durante la fase di convalida, vengono utilizzati parametri del modello ottimali, che possono generare metriche distorte. L'utilizzo del set di dati di test per valutare la qualità del modello dopo la fase di convalida fornisce una valutazione imparziale della qualità del modello.

Per identificare i dati di addestramento, test e convalida, utilizza i file CSV come descritto nella sezione successiva.

Creare file CSV con URI ed etichette dei video

Dopo aver caricato i file in Google Cloud Storage, puoi creare file CSV che elencano tutti i dati di addestramento e le etichette delle categorie per tali dati. I file CSV possono avere qualsiasi nome file, devono trovarsi nello stesso bucket dei file video, avere la codifica UTF-8 e terminare con un'estensione .csv.

Esistono tre file che puoi utilizzare per l'addestramento e la verifica del modello:

File	Descrizione
Elenco dei file di addestramento del modello	Contiene i percorsi per addestrare, testare e convalidare i file CSV. Questo file viene utilizzato per identificare le posizioni di un massimo di tre file CSV distinti che descrivono i dati di addestramento e test. Di seguito sono riportati alcuni esempi dei contenuti del file CSV con l'elenco dei file: Esempio 1: TRAIN,gs://automl-video-demo-data/hmdb_split1_5classes_train.csv TEST,gs://automl-video-demo-data/hmdb_split1_5classes_test.csv Esempio 2: UNASSIGNED,gs://automl-video-demo-data/hmdb_split1_5classes_all.csv
Dati di addestramento	Utilizzato per addestrare il modello. Contiene i percorsi dei file video, l'ora di inizio e di fine dei segmenti video ed etichette che identificano l'oggetto del segmento video. Se specifichi un file CSV dei dati di addestramento, devi specificare anche un file CSV dei dati di test.
Dati di test	Utilizzato per testare il modello durante la fase di addestramento. Contiene i percorsi dei file video, l'ora di inizio e di fine dei segmenti video ed etichette che identificano l'oggetto del segmento video. Se specifichi un file CSV dei dati di test, devi specificare anche un file CSV dei dati di addestramento.
Dati non assegnati	Utilizzato sia per l'addestramento del modello sia per il test. Contiene i percorsi dei file video, l'ora di inizio e di fine dei segmenti video ed etichette che identificano l'oggetto del segmento video. Le righe nel file non assegnato vengono suddivise automaticamente in dati di addestramento e test. l'80% per l'addestramento e il 20% per i test. Puoi specificare solo un file CSV con i dati non assegnati senza file CSV dei dati di addestramento e test. Puoi anche specificare solo i file CSV dei dati di addestramento e test senza un file CSV dei dati non assegnato.

I file di addestramento, test e non assegnati hanno una riga per ogni video nel set che stai caricando, con le seguenti colonne per riga:

I contenuti da classificare o annotare. Questo campo contiene l'URI Google Cloud Storage del video. Gli URI Google Cloud Storage sono sensibili alle maiuscole.
Un'etichetta che identifica il modo in cui il video viene classificato. . Le etichette devono iniziare con una lettera e contenere solo lettere, numeri e trattini bassi. Puoi specificare più etichette per un video aggiungendo nel file CSV più righe che identificano ciascuna lo stesso segmento video, con un'etichetta diversa per ogni riga.
Ora di inizio e di fine del segmento video. Questi due campi separati da virgole identificano l'ora di inizio e l'ora di fine del segmento video da analizzare, in secondi. L'ora di inizio deve essere precedente all'ora di fine. Entrambi i valori non devono essere negativi e devono rientrare nell'intervallo di tempo del video. Ad esempio, 0.09845,1.3600555. Per utilizzare l'intero contenuto del video, specifica un valore di inizio pari a 0 e un'ora di fine dell'intera durata del video o "inf". Ad esempio: 0,inf.

Di seguito sono riportate alcune righe di esempio per un file di dati CSV:

Singola etichetta:

gs://<your-video-path>/vehicle.mp4,u-turn,0,5.4

Più etichette per lo stesso segmento video:

gs://<your-video-path>/vehicle.mp4,right-turn,0,8.285
gs://<your-video-path>/vehicle.mp4,left-turn,0,8.285
gs://<your-video-path>/vehicle.mp4,u-turn,0,8.285

Utilizzo di inf per indicare la fine di un video:

gs://<your-video-path>/vehicle.mp4,right-turn,0,inf

Per ottenere risultati ottimali, devi includere almeno diverse centinaia di segmenti video di addestramento per etichetta in modo da creare un modello accurato. Questo numero può variare a seconda della complessità dei dati.

Puoi anche fornire i video nel file di dati CSV senza specificare alcuna etichetta. Devi quindi utilizzare l'interfaccia utente di AutoML Video per applicare etichette ai dati prima di addestrare il modello. Per farlo, ti basta fornire l'URI Cloud Storage del video seguito da tre virgole, come mostrato nell'esempio seguente.

gs://<your-video-path>/vehicle.mp4,,,

Non è necessario specificare dati di convalida per verificare i risultati del modello addestrato. AutoML Video suddivide automaticamente le righe identificate per l'addestramento in dati di addestramento e convalida. il 70% per la formazione e il 30% per la convalida.

Salva i contenuti come file CSV nel bucket Google Cloud Storage.

Errori comuni dei file CSV

Utilizzo di caratteri Unicode nelle etichette. Ad esempio, i caratteri giapponesi non sono supportati.
Utilizzare spazi e caratteri non alfanumerici nelle etichette.
Righe vuote.
Colonne vuote (righe con due virgole successive).
Uso errato delle lettere maiuscole nei percorsi video di Cloud Storage.
Controllo dell'accesso non corretto configurato per i tuoi file video. Il tuo account di servizio deve disporre di un accesso in lettura o superiore oppure i file devono essere leggibili pubblicamente.
Riferimenti a file non video (ad esempio file PDF o PSD). Analogamente, i file che non sono file video, ma che sono stati rinominati con un'estensione video, causeranno un errore.
L'URI del video rimanda a un bucket diverso da quello del progetto corrente. È possibile accedere solo ai video nel bucket del progetto.
File non in formato CSV.