Ein Dataset enthält repräsentative Beispiele für den zu klassifizierenden Inhaltstyp und ist mit den Kategorielabels gekennzeichnet, die das benutzerdefinierte Modell verwenden soll. Das Dataset dient als Eingabe zum Trainieren eines Modells.
Die wesentlichen Schritte zum Erstellen eines Datasets sind:
- Erstellen Sie ein Dataset und geben Sie an, ob für jedes Element mehrere Labels zulässig sein sollen.
- Importieren Sie Datenelemente in das Dataset.
- Versehen Sie die Elemente mit Labels.
Ein Projekt kann mehrere Datasets enthalten, die jeweils zum Trainieren eines separaten Modells verwendet werden. Sie können eine Liste der verfügbaren Datasets abrufen und nicht mehr benötigte Datasets löschen.
Dataset erstellen
Der erste Schritt zum Erstellen eines benutzerdefinierten Modells besteht darin, ein leeres Dataset zu erstellen, das mit den Trainingsdaten für das Modell gefüllt wird.
Web-UI
Mit der AutoML Video-UI können Sie ein neues Dataset erstellen und Elemente von derselben Seite in dieses Dataset importieren.- Öffnen Sie die AutoML Video-UI. Auf der Seite Datasets wird der Status zuvor erstellter Datasets für das aktuelle Projekt angezeigt. Wenn Sie ein Dataset für ein anderes Projekt hinzufügen möchten, wählen Sie das betreffende Projekt in der Drop-down-Liste rechts oben in der Titelleiste aus.
- Klicken Sie auf der Seite Datasets auf Dataset erstellen.
Der folgende Bildschirm wird angezeigt: - Geben Sie Informationen zum Dataset ein:
- Geben Sie einen Namen für das Dataset an.
- Wählen Sie Videoklassifizierung aus.
- Klicken Sie auf Dataset erstellen.
Der folgende Bildschirm wird angezeigt:
- Geben Sie einen Namen für das Dataset an.
- Geben Sie die folgenden Informationen ein:
- Geben Sie den Cloud Storage-URI der CSV-Datei an, die die URIs Ihrer Trainingsdaten enthält (siehe Daten vorbereiten).
In dieser Kurzanleitung verwenden Sie:
automl-video-demo-data/hmdb_split1.csv
- Klicken Sie auf Weiter, um den Import Ihrer Daten zu starten.
Der folgende Bildschirm wird angezeigt:
- Geben Sie den Cloud Storage-URI der CSV-Datei an, die die URIs Ihrer Trainingsdaten enthält (siehe Daten vorbereiten).
Der Importvorgang kann je nach Anzahl und Länge der von Ihnen bereitgestellten Videos einige Zeit in Anspruch nehmen.
REST UND BEFEHLSZEILE
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- dataset-name: Name des Datasets, das in der Benutzeroberfläche angezeigt werden soll
- Hinweis:
- project-number: Nummer Ihres Projekts
- location-id: Die Cloud-Region, in der die Annotation erfolgen soll. Unterstützte Cloud-Regionen sind:
us-east1
,us-west1
,europe-west1
,asia-east1
. Wenn keine Region angegeben ist, wird eine Region basierend auf dem Speicherort der Videodatei festgelegt.
HTTP-Methode und URL:
POST https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets
JSON-Text der Anfrage:
{ "displayName": "dataset-name", "videoClassificationDatasetMetadata": { } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
" https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri " https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets" | Select-Object -Expand Content
name
für Ihren Vorgang zurück. Das folgende Beispiel zeigt eine solche Antwort, wobei project-number
die Nummer Ihres Projekts und operation-id
die ID des lang andauernden Vorgangs ist, der für die Anfrage erstellt wurde.
Java
Node.js
Python
Elemente in ein Dataset importieren
Nachdem Sie ein Dataset erstellt haben, können Sie Daten mit Labels aus CSV-Dateien importieren, die in einem Cloud Storage-Bucket gespeichert sind. Weitere Informationen zum Vorbereiten von Daten und Erstellen einer CSV-Datei für den Import finden Sie unter Trainingsdaten vorbereiten.
Sie können Elemente in ein leeres Dataset importieren oder zusätzliche Elemente in ein vorhandenes Dataset importieren.
Web-UI
Ihre Daten werden beim Erstellen Ihres Datasets importiert.REST UND BEFEHLSZEILE
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- input-uri: Ein Cloud Storage-Bucket, der die Datei enthält, die Sie annotieren möchten, einschließlich des Dateinamens. Muss mit gs:// beginnen. Beispiel:
"inputUris": ["gs://automl-video-demo-data/hmdb_split1.csv"]
- dataset-id: Ersetzen Sie diesen Wert durch die Dataset-ID für Ihr Dataset (nicht den Anzeigenamen). Beispiel:
VCN4798585402963263488
- Hinweis:
- project-number: Nummer Ihres Projekts
- location-id: Die Cloud-Region, in der die Annotation erfolgen soll. Unterstützte Cloud-Regionen sind:
us-east1
,us-west1
,europe-west1
,asia-east1
. Wenn keine Region angegeben ist, wird eine Region basierend auf dem Speicherort der Videodatei festgelegt.
HTTP-Methode und URL:
POST https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id:importData
JSON-Text der Anfrage:
{ "inputConfig": { "gcsSource": { "inputUris": input-uri } } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
" https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id:importData"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri " https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets/dataset-id:importData" | Select-Object -Expand Content
VCN7506374678919774208
enthält.
Sie können den Status der Aufgabe anhand der Vorgangs-ID abrufen. Ein Beispiel finden Sie unter Status eines Vorgangs abrufen.
Java
Node.js
Python
Trainingselemente mit Labels versehen
Jedem Element in einem Dataset muss mindestens ein Kategorielabel zugewiesen sein, damit es dem Trainieren eines Modells von Nutzen sein kann. Elemente ohne Kategorielabel werden von AutoML Video ignoriert. Sie können Labels für Ihre Trainingselemente auf zwei verschiedene Arten angeben:
- Fügen Sie Labels in die CSV-Datei ein.
- Versehen Sie Elemente in der AutoML Video-UI mit Labels.
Weitere Informationen zum Labeling von Elementen in einer CSV-Datei finden Sie unter Trainingsdaten vorbereiten.
Wenn Sie Elemente in der AutoML Video-UI mit einem Label versehen und Details zum Dataset abrufen möchten, wählen Sie auf der Seite mit der Dataset-Liste das Dataset aus. Der Anzeigename des ausgewählten Datasets wird in der Titelleiste angezeigt. Die einzelnen Elemente im Dataset werden zusammen mit ihren Labels aufgelistet. Die Navigationsleiste auf der linken Seite fasst die Anzahl der Elemente mit und ohne Label zusammen. Sie können damit auch die Liste der Elemente nach Label filtern.
Führen Sie folgende Schritte aus, um Videos Labels zuzuweisen oder Videolabels zu ändern:
- Klicken Sie auf der Seite für das Dataset auf das Video, für das Sie Labels einfügen oder ändern möchten.
Gehen Sie auf der Seite für das Video folgendermaßen vor:
- Klicken Sie auf Segment hinzufügen.
- Ziehen Sie die Pfeile auf beiden Seiten der Videozeitachse, um den Bereich zu definieren, den Sie mit einem Label versehen möchten. Standardmäßig ist die gesamte Dauer des Videos ausgewählt.
- Klicken Sie in der Liste der Labels auf die Labels, die Sie auf das Video anwenden möchten. Die Farbleiste für das Label wird nach seiner Auswahl ausgefüllt.
- Klicken Sie auf Speichern.
Wenn Sie ein neues Label für das Dataset hinzufügen müssen, klicken Sie auf der Seite für das Dataset oberhalb der Liste der vorhandenen Labels auf die drei Punkte neben Labels filtern und dann auf Neues Label hinzufügen.
Datasets auflisten
Ein Projekt kann zahlreiche Datasets enthalten. In diesem Abschnitt wird beschrieben, wie Sie eine Liste der verfügbaren Datasets für ein Projekt abrufen.
Web-UI
Wenn Sie über die AutoML Video-UI eine Liste der verfügbaren Datasets ansehen möchten, rufen Sie die Seite Datasets auf.Wenn Sie die Datasets für ein anderes Projekt anzeigen möchten, wählen Sie das Projekt in der Drop-down-Liste oben rechts in der Titelleiste aus.
REST UND BEFEHLSZEILE
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- project-number: Nummer Ihres Projekts
- location-id: Die Cloud-Region, in der die Annotation erfolgen soll. Unterstützte Cloud-Regionen sind:
us-east1
,us-west1
,europe-west1
,asia-east1
. Wenn keine Region angegeben wurde, wird eine Region anhand des Speicherorts einer Videodatei bestimmt.
HTTP-Methode und URL:
https://automl.googleapis.com/v1beta1/projects/project-number/locations/location-id/datasets
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
Java
Node.js
Python
Dataset löschen
Im folgenden Code wird gezeigt, wie ein Dataset gelöscht wird.
.Web-UI
-
Rufen Sie in der AutoML Video-UI die Seite Datasets auf.
- Klicken Sie auf das Dreipunkt-Menü ganz rechts in der zu löschenden Zeile und wählen Sie Dataset löschen aus.
- Klicken Sie im Bestätigungsdialogfeld auf Bestätigen.
REST UND BEFEHLSZEILE
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- dataset-name: Der vollständige Name des Datasets aus der Antwort, die Sie beim Erstellen des Datasets erhalten haben. Er hat das Format:
projects/project-number/locations/location-id/datasets/dataset-id
- project-number: Nummer Ihres Projekts
- location-id: Die Cloud-Region, in der die Annotation erfolgen soll. Unterstützte Cloud-Regionen sind:
us-east1
,us-west1
,europe-west1
,asia-east1
. Wenn keine Region angegeben wurde, wird eine Region anhand des Speicherorts einer Videodatei bestimmt. - dataset-id: Die ID, die Sie beim Erstellen des Datasets angegeben haben
HTTP-Methode und URL:
DELETE https://automl.googleapis.com/v1beta1/dataset-name
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
Java
Node.js
Python