Diese Legacy-Version von AutoML Vision wurde verworfen und ist nach dem 31. März 2024 nicht mehr in Google Cloud verfügbar. Die gesamte Funktionalität von AutoML Vision und neue Features sind auf der Vertex AI-Plattform verfügbar. Informationen zum Migrieren Ihrer Ressourcen finden Sie unter Zu Vertex AI migrieren.

Images mithilfe der API in der Console mit Labels versehen

In dieser Kurzanleitung werden folgende Verfahren erläutert:

Dataset mit Bildern, die Begrenzungsrahmen mit Labels enthalten, erstellen
Benutzerdefiniertes Modell mit dem Dataset trainieren

In dieser Kurzanleitung verwenden Sie die benutzerdefinierte Benutzeroberfläche (UI) zur Interaktion mit der AutoML Vision API. Sie können alle Schritte in dieser Kurzanleitung auch mithilfe der AutoML API ausführen. Weitere Informationen zur Verwendung der Benutzeroberfläche oder der API finden Sie in den Anleitungen.

Hinweis

Region: Derzeit müssen sich Projektressourcen in der Region us-central1 befinden, um diese API verwenden zu können.

Bevor Sie die AutoML Vision-Objekterkennung verwenden können, müssen Sie ein Google Cloud-Projekt erstellen, das noch nie mit einem anderen AutoML-Produkt verwendet wurde, und die AutoML Vision-Objekterkennung für dieses Projekt aktivieren.

Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

Zur Projektauswahl

Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

Cloud AutoML and Storage APIs aktivieren.

Aktivieren Sie die APIs

Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

Zur Projektauswahl

Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

Cloud AutoML and Storage APIs aktivieren.

Aktivieren Sie die APIs

Beta-Anforderungen

Für diese Betaversion müssen Sie us-central1 als Region angeben.

Dataset vorbereiten

In dieser Kurzanleitung verwenden Sie ein Dataset, das aus Open Images Dataset Version 4 erstellt wurde. Dieses öffentlich verfügbare „Salads”-Dataset ist unter gs://cloud-ml-data/img/openimage/csv/salads_ml_use.csv gespeichert.

Das CSV-Format lautet:

TRAINING,gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg,Salad,0.0,0.0954,,,0.977,0.957,,
VALIDATION,gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg,Seafood,0.0154,0.1538,,,1.0,0.802,,
TEST,gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg,Tomato,0.0,0.655,,,0.231,0.839,,

Grafik: Beispiel für Dataset-Bild — `3916261642_0a504acd60_o.jpg`

Jede Zeile entspricht einem Objekt, das sich in einem größeren Bild befindet. Alle Objekte sind dabei jeweils spezifisch als Test-, Trainings- oder Validierungsdaten festgelegt. Die drei hier angegebenen Zeilen geben drei verschiedene Objekte an, die sich im gleichen Bild befinden, das unter gs://cloud-ml-data/img/openimage/3/2520/3916261642_0a504acd60_o.jpg verfügbar ist. Jede Zeile hat ein anderes Label: Salad, Seafood, Tomato. Daneben gibt es weitere Zeilen mit Labels wie Baked goods oder Cheese.

Über die Eckpunkte oben links und unten rechts werden für jedes Bild Begrenzungsrahmen festgelegt:

(0, 0) entspricht dem Eckpunkt ganz oben links.
(1, 1) entspricht dem Eckpunkt ganz unten rechts.

Für die erste Zeile, die oben angezeigt wird, lauten die Koordinaten (x, y) für den Eckpunkt oben links des Objekts mit dem Label Salad (0,0, 0,0954). Die Koordinaten für den Eckpunkt unten rechts des Objekts lauten (0,977, 0,957).

Ausführliche Informationen zum Formatieren der CSV-Datei und zu den Mindestanforderungen zum Erstellen eines gültigen Datasets finden Sie unter Trainingsdaten vorbereiten.

Dataset erstellen und Trainingsbilder importieren

Öffnen Sie die Benutzeroberfläche von AutoML Vision Object Detection und wählen Sie Ihr Projekt aus der Drop-down-Liste in der Titelleiste aus.
Wenn Sie die UI der AutoML Vision Object Detection zum ersten Mal öffnen, müssen Sie die AutoML API aktivieren, falls sie noch nicht aktiv ist.
Wählen Sie Erste Schritte im Pop-up-Fenster aus, wenn Sie dazu aufgefordert werden.
Sie werden zu einer Seite mit einer Liste der Datasets weitergeleitet. Wählen Sie Neues Dataset aus, um ein neues Dataset zu erstellen.
Geben Sie einen eindeutigen Namen für das Dataset ein.
Geben Sie im darauffolgenden Fenster den Speicherort der zu importierenden Trainingsdaten ein.
Geben Sie im Textfeld Select a CSV file on Cloud Storage (CSV-Datei in Cloud Storage auswählen) den Pfad zu der Beispiel-CSV-Datei ein. Das Präfix gs:// wird automatisch hinzugefügt.
```
cloud-ml-data/img/openimage/csv/salads_ml_use.csv
```
Alternativ können Sie Durchsuchen auswählen und in einem Ihrer Google Cloud Storage-Buckets die CSV-Datei aufrufen.

In dieser Kurzanleitung werden Beispieldaten verwendet, die in einem öffentlichen Google Cloud Storage-Bucket bereitgestellt werden. Die Trainingsdaten sind Beispiel-JPG-Bilder, die mit dem Begrenzungsrahmen und dem Label der Objekte versehen sind, die das Modell zu identifizieren lernen soll. Verwenden Sie zum Importieren der Trainingsdaten in das Dataset eine CSV-Datei, die auf die Image-Dateien (JPEG, PNG, GIF, BMP oder ICO) verweist. Weitere Informationen zu den Format- und Bildspezifikationen finden Sie unter Trainingsdaten vorbereiten.
Wählen Sie Importieren aus.
Ihr Dataset zeigt während des Imports Ihrer Bilder den Status Running:importing images an. Dieser Vorgang dauert nur wenige Minuten.

Wenn Ihre Trainingsdaten erfolgreich importiert wurden, steht in der Spalte Status Success:Creating dataset und die Benutzeroberfläche zeigt die generierte ID für das Dataset (die bei AutoML API-Aufrufen verwendet wird) sowie die Anzahl der importierten Artikel an.

Wenn beim Importieren der Bilder Probleme auftreten, wird als Status Warning: Importing images angezeigt. Wählen Sie den Dataset-Namen und Details aus, um die Fehler bei einem bestimmten Bildimport anzuzeigen.

Modell trainieren

Nachdem Sie Ihr Dataset erstellt und Ihre Trainingsdaten in Ihr Dataset importiert haben, können Sie Ihr benutzerdefiniertes Modell trainieren.

Klicken Sie auf der Seite mit der Liste der Datasets auf den Namen des Datasets.
Wählen Sie den Tab Train (Trainieren) aus. Daraufhin werden alle Labels und ihre Verteilung auf Trainings-, Test- und Validierungs-Datasets angezeigt.
Wählen Sie Start training (Training starten) aus, um eine Seitenleiste mit Trainingsoptionen zu öffnen.
Geben Sie einen Namen für das benutzerdefinierte Modell ein oder übernehmen Sie den Standardnamen. Sie können in der Seitenleiste auch die Art der Modelloptimierung auswählen: "Latenz" oder "Genauigkeit".

Klicken Sie auf das Kästchen Modell nach dem Training auf dem Knoten bereitstellen, um die automatische Bereitstellung zu aktivieren. Andernfalls werden Sie nach dem Training dazu aufgefordert, das Modell manuell bereitzustellen, bevor Sie Vorhersagen treffen können.
Wählen Sie Start Training (Training starten) aus.

Das Trainieren eines Modells kann mehrere Stunden dauern. Die typische Trainingszeit für das Beispiel beträgt etwa eine Stunde.

Nachdem das Modell erfolgreich trainiert wurde, erhalten Sie eine Nachricht an die E-Mail-Adresse, unter der Sie sich beim Programm registriert haben.

Benutzerdefiniertes Modell bewerten

Nach dem Training eines Modells bewertet die Objekterkennung von AutoML Vision die Qualität und Genauigkeit des neuen Modells. So rufen Sie die Bewertungsmesswerte für Ihr Modell auf:

Öffnen Sie die UI der AutoML Vision-Objekterkennung und klicken Sie in der linken Navigationsleiste auf den Tab Modelle mit dem Glühbirnensymbol.
Klicken Sie auf den Namen des Modells, das bewertet werden soll.
Klicken Sie ggf. unterhalb der Titelleiste auf den Tab Bewerten.

Wenn das Training für das Modell abgeschlossen wurde, zeigt die AutoML Vision-Objekterkennung die Bewertungsmesswerte für das Modell an. Sie liefert Werte für Precision und Recall des Modells als Ganzes sowie für jedes Objektlabel bei unterschiedlichen Werten und Schwellenwerten für Intersection over Union (IoU). Um die Messwerte für ein bestimmtes Objektlabel aufzurufen, wählen Sie das Label aus der Liste "Filterlabels" aus.

Mit Precision und Recall wird gemessen, wie gut das Modell Informationen erfasst und wie viele es auslässt. Precision gibt für alle Objekte, die mit einem bestimmten Label versehen wurden, an, wie viele davon tatsächlich dieses Label hätten erhalten sollen. Recall gibt an, wie viele der Objekte, die als eine bestimmte Entität hätten identifiziert werden sollen, dann tatsächlich dieser Entität zugeordnet waren.

Mit folgenden Daten können Sie nun bewerten, ob Ihr Modell einsatzbereit ist:

Geringe Precision- oder Recall-Werte können darauf hinweisen, dass das Modell zusätzliche Trainingsdaten benötigt.
Perfekte Precision- oder Recall-Werte können darauf hindeuten, dass die Daten zu einfach sind und sich unter Umständen nicht gut verallgemeinern lassen.

Benutzerdefiniertes Modell verwenden

Nachdem das benutzerdefinierte Modell erfolgreich trainiert wurde, können Sie es verwenden, um Objekte in einem Bild mit Begrenzungsrahmen und Labels zu identifizieren. Wählen Sie den Tab Test und Nutzung aus.

Wenn Sie die automatische Bereitstellung nicht aktiviert haben, werden Sie aufgefordert, ein Modell bereitzustellen, bevor Sie Vorhersagen treffen können.

Modell manuell bereitstellen

Bei AutoML Vision müssen Sie ein trainiertes Modell bereitstellen, bevor Sie Vorhersageanfragen an das Modell senden können.

Stellen Sie das Modell auf dem Tab Test und Nutzung manuell bereit. Wählen Sie dazu die Option Modell bereitstellen im Banner unter dem Modellnamen aus.
Wenn Sie Modell bereitstellen auswählen, wird das Fenster für die Modellbereitstellung geöffnet.
Im Fenster mit den Optionen für die Modellbereitstellung können Sie die Anzahl der bereitzustellenden Knoten auswählen und die verfügbaren Vorhersageabfragen pro Sekunde anzeigen lassen.
Wählen Sie Bereitstellen aus, um mit der Modellimplementierung zu beginnen.
Sie erhalten eine E-Mail, sobald die Bereitstellung des Modells abgeschlossen ist.

Vorhersagen treffen

Nachdem das Modell bereitgestellt wurde, geben Sie den Pfad zu Ihrem Testbild auf der Seite Testen und verwenden an, z. B. dieses lokal gespeicherte Bild. AutoML Vision analysiert das Bild mithilfe des Modells und zeigt dann mit Labels versehene Objekte und deren Begrenzungsrahmen im Bild an.

Seite mit der Vorhersage auf hochgeladenem Bild

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:

Wenn Sie das benutzerdefinierte Modell oder das Dataset nicht mehr benötigen, können Sie es löschen.

Löschen Sie Ihr Projekt mit der GCP Console, wenn Sie es nicht mehr benötigen, um unnötige Google Cloud Platform-Gebühren zu vermeiden.

Bereitstellung eines Modells entfernen

Während der Bereitstellung fallen für das Modell Gebühren an.

Wählen Sie den Tab Test und Nutzung direkt unter der Titelleiste aus.
Wählen Sie aus dem Banner unterhalb des Modellnamens Deployment entfernen aus, um das Fenster zum Aufheben der Bereitstellung zu öffnen.
Wählen Sie Remove deployment (Deployment entfernen) aus, um die Bereitstellung des Modells zu entfernen.
Sie erhalten eine E-Mail, wenn die Bereitstellung vollständig entfernt wurde.

Projekt löschen (optional)

Löschen Sie das Projekt mit der Google Cloud Console, wenn Sie es nicht benötigen. Damit vermeiden Sie unnötige Kosten für die Google Cloud Platform.

Images mithilfe der API in der Console mit Labels versehen

Hinweis

Beta-Anforderungen

Dataset vorbereiten

Dataset erstellen und Trainingsbilder importieren

Modell trainieren

Benutzerdefiniertes Modell bewerten

Benutzerdefiniertes Modell verwenden

Modell manuell bereitstellen

Vorhersagen treffen

Bereinigen

Bereitstellung eines Modells entfernen

Projekt löschen (optional)

Nächste Schritte