Gestione dei set di dati
Un set di dati contiene campioni rappresentativi del tipo di contenuti che vuoi etichettare, con le etichette riquadro di delimitazione che vuoi che il modello utilizzi. Il set di dati funge da input per l'addestramento di un modello.
Di seguito sono riportati i passaggi principali per la creazione di un set di dati:
- Crea un set di dati e specifica se consentire più etichette su ogni elemento.
- Importa gli elementi di dati nel set di dati.
Prima dell'addestramento, assicurati di preparare i dati prima di addestrare un modello.
Un progetto può avere più set di dati, ognuno dei quali viene utilizzato per addestrare un modello separato. Puoi ottenere un elenco dei set di dati disponibili ed eliminare quelli che non ti servono più.
Creazione di un set di dati
Il primo passaggio nella creazione di un modello è creare un set di dati vuoto che alla fine conterrà i dati di addestramento del modello.
UI web
L'interfaccia utente per il monitoraggio degli oggetti video di AutoML consente di creare un nuovo set di dati e importare elementi al suo interno dalla stessa pagina.- Apri l'interfaccia utente di monitoraggio degli oggetti video AutoML. La pagina Set di dati mostra lo stato dei set di dati creati in precedenza per il progetto attuale. Per aggiungere un set di dati per un altro progetto, seleziona il progetto dall'elenco a discesa in alto a destra nella barra del titolo.
- Nella pagina Set di dati, fai clic su Crea set di dati.
- Nella finestra di dialogo Crea nuovo set di dati, segui questi passaggi:
- Specifica un nome per il set di dati.
- Seleziona Monitoraggio oggetti video.
- Fai clic su Crea set di dati.
- Nella pagina del set di dati, fornisci l'URI Cloud Storage del file CSV che contiene gli URI dei dati di addestramento, senza il prefisso
gs://
all'inizio. - Sempre nella pagina del set di dati, fai clic su Continua per avviare l'importazione.
REST
L'esempio seguente crea un set di dati denominato my_dataset01
che supporta i casi d'uso di monitoraggio degli oggetti. Il set di dati appena creato non contiene dati
fino a quando non importi elementi al suo interno.
Salva il "name"
del nuovo set di dati (dalla risposta) per utilizzarlo con altre operazioni, come l'importazione di elementi nel set di dati e l'addestramento di un modello.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- dataset-name: il nome del set di dati di destinazione.
Ad esempio,my_dataset_01
- Nota:
- project-number: numero del progetto
- location-id: la regione Cloud in cui deve avvenire l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
easia-east1
. Se non viene specificata alcuna regione, verrà determinata in base alla posizione del file video.
Metodo HTTP e URL:
POST https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets
Corpo JSON della richiesta:
{ "displayName": "dataset-name", "videoObjectTrackingDatasetMetadata": { } }
Per inviare la richiesta, scegli una delle seguenti opzioni:
arricciatura
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: project-number" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "project-number" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets" | Select-Object -Expand Content
VOT12345....
Java
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Importazione di elementi in un set di dati
Dopo aver creato un set di dati, puoi importare i dati etichettati dai file CSV archiviati in un bucket Cloud Storage. Per maggiori dettagli sulla preparazione dei dati e sulla creazione di file CSV per l'importazione, consulta Preparazione dei dati di addestramento.
Puoi importare elementi in un set di dati vuoto o importare elementi aggiuntivi in un set di dati esistente.
UI web
In genere, i dati vengono importati al momento della creazione del set di dati.Tuttavia, se devi importare i dati dopo aver creato il set di dati:
- Apri l'interfaccia utente di monitoraggio degli oggetti video AutoML. La pagina Set di dati mostra lo stato dei set di dati creati in precedenza per il progetto attuale.
- Nell'elenco, fai clic sul set di dati in cui vuoi importare i dati.
- Nella scheda Importa, fornisci l'URI Cloud Storage del
file CSV che contiene gli URI dei dati di addestramento,
senza il prefisso
gs://
all'inizio. - Sempre nella scheda Importa del set di dati, fai clic su Continua per avviare l'importazione.
REST
Per importare i dati di addestramento, utilizza il metodoimportData
. Questo metodo richiede due parametri:
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- dataset-id: l'ID del set di dati. L'ID è l'ultimo elemento del nome del set di dati. Ad esempio:
- nome set di dati:
projects/project-number/locations/location-id/datasets/3104518874390609379
- ID set di dati:
3104518874390609379
- nome set di dati:
- bucket-name: sostituiscilo con il nome del bucket Cloud Storage in cui hai archiviato il file CSV con l'elenco dei file di addestramento dei modelli.
- csv-file-name: sostituiscilo con il nome del tuo file CSV con l'elenco dei file di addestramento dei modelli.
- Nota:
- project-number: numero del progetto
- location-id: la regione Cloud in cui deve avvenire l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
easia-east1
. Se non viene specificata alcuna regione, verrà determinata in base alla posizione del file video.
Metodo HTTP e URL:
POST https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id:importData
Corpo JSON della richiesta:
{ "inputConfig": { "gcsSource": { "inputUris": ["gs://bucket-name/csv-file-name.csv"] } } }
Per inviare la richiesta, scegli una delle seguenti opzioni:
arricciatura
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: project-number" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id:importData"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "project-number" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id:importData" | Select-Object -Expand Content
VOT7506374678919774208
.
Java
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Etichettatura degli elementi di addestramento
Per essere utile per l'addestramento di un modello, ogni elemento di un set di dati deve contenere almeno un riquadro di delimitazione e un'etichetta di categoria assegnata. Puoi fornire etichette e riquadri di delimitazione per gli elementi di addestramento in due modi:
- Includi etichette e riquadri di delimitazione nel file CSV
- Applica etichette e riquadri di delimitazione ai tuoi elementi nell'interfaccia utente di monitoraggio di oggetti video AutoML.
Per maggiori dettagli su come etichettare gli elementi nel file CSV, consulta Preparazione dei dati di addestramento.
Per etichettare gli elementi nell'interfaccia utente di monitoraggio degli oggetti video AutoML, seleziona il set di dati dalla pagina dell'elenco del set di dati per visualizzarne i dettagli. Il nome visualizzato del set di dati selezionato viene visualizzato nella barra del titolo e la pagina elenca i singoli elementi del set di dati insieme alle relative etichette. La barra di navigazione a sinistra riassume il numero di elementi etichettati e non etichettati. Consente inoltre di filtrare l'elenco di elementi per etichetta.
Per assegnare etichette e riquadri di delimitazione ai video senza etichetta o per modificare etichette e riquadri di delimitazione dei video:
- Nella pagina del set di dati, fai clic sul video per cui vuoi aggiungere le etichette.
Nella pagina del video, segui questi passaggi:
- Fai partire il video fino a quando non vedi l'elemento che vuoi etichettare.
- Trascina il cursore per tracciare un riquadro di delimitazione intorno all'elemento.
- Dopo aver disegnato il riquadro di delimitazione, seleziona l'etichetta che vuoi utilizzare.
- Fai clic su Salva.
Se devi aggiungere una nuova etichetta per il set di dati, nella pagina relativa al set di dati, sopra l'elenco delle etichette esistenti, fai clic sui tre puntini accanto a Filtra etichette, quindi fai clic su Aggiungi nuova etichetta.
Modifica delle etichette nei dati
Puoi anche modificare le etichette applicate ai video in un set di dati. Nella UI di monitoraggio degli oggetti video AutoML, procedi nel seguente modo:
- Nella pagina del set di dati, fai clic sul video di cui vuoi modificare le etichette.
Nella pagina del video, segui questi passaggi:
- Nell'elenco delle etichette a sinistra, seleziona l'etichetta da modificare.
- Nell'anteprima del video, fai clic con il tasto destro del mouse sul riquadro di delimitazione del video e seleziona l'etichetta.
- Fai clic su Salva.
Elenco dei set di dati
Un progetto può includere numerosi set di dati. Questa sezione descrive come recuperare un elenco dei set di dati disponibili per un progetto.
UI web
Per visualizzare un elenco dei set di dati disponibili utilizzando l'interfaccia utente per il monitoraggio degli oggetti video AutoML, vai alla pagina Set di dati.
Per visualizzare i set di dati di un altro progetto, seleziona il progetto dall'elenco a discesa in alto a destra nella barra del titolo.
REST
Utilizza i seguenti comandicurl
o PowerShell per ottenere un elenco dei tuoi set di dati e il numero di video di esempio importati nel set di dati.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- project-number: il numero del progetto
- location-id: la regione Cloud in cui deve avvenire l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
easia-east1
. Se non viene specificata alcuna regione, verrà determinata in base alla posizione del file video.
Metodo HTTP e URL:
GET https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets
Per inviare la richiesta, scegli una delle seguenti opzioni:
arricciatura
Esegui questo comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: project-number" \
"https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets "
PowerShell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "project-number" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets " | Select-Object -Expand Content
VOT3940649673949184000
, è l'ID operazione dell'operazione a lunga esecuzione creata per la richiesta e fornito nella risposta quando hai avviato l'operazione.
Java
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Eliminazione di un set di dati
Il codice seguente mostra come eliminare un set di dati.
UI web
-
Vai alla pagina Set di dati nell'UI di monitoraggio degli oggetti video AutoML.
- Fai clic sul menu con tre puntini all'estrema destra della riga che vuoi eliminare e seleziona Elimina set di dati.
- Fai clic su Conferma nella finestra di dialogo di conferma.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- project-number: il numero del progetto
- location-id: la regione Cloud in cui deve avvenire l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
easia-east1
. Se non viene specificata alcuna regione, verrà determinata in base alla posizione del file video. - datase-id: sostituisci con l'identificatore dell'ID del tuo set di dati.
Metodo HTTP e URL:
DELETE https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere un codice di stato riuscito (2xx) e una risposta vuota.
Java
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per eseguire l'autenticazione in AutoML Video Object Tracking, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.