Labels mithilfe der Befehlszeile in einem Bild erkennen
Auf dieser Seite erfahren Sie, wie Sie mit der REST-Benutzeroberfläche und dem Befehl curl
drei Anfragen zur Elementerkennung und Annotation an die Vision API senden.
Mit der Vision API können Google-Technologien zur visuellen Erkennung leicht in Entwickleranwendungen eingebunden werden. Sie können Bilddaten und die gewünschten Elementtypen an die Vision API senden, die dann anhand der für Sie interessanten Bildattribute eine entsprechende Antwort zurückgibt. Weitere Informationen zu den angebotenen Elementtypen finden Sie in der Liste aller Vision API-Elemente.
Hinweis
- Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
- Installieren Sie die Google Cloud CLI.
-
Führen Sie folgenden Befehl aus, um die gcloud CLI zu initialisieren:
gcloud init
-
Google Cloud-Projekt erstellen oder auswählen.
-
Erstellen Sie ein Google Cloud-Projekt:
gcloud projects create PROJECT_ID
Ersetzen Sie
PROJECT_ID
durch einen Namen für das Google Cloud-Projekt, das Sie erstellen. -
Wählen Sie das von Ihnen erstellte Google Cloud-Projekt aus:
gcloud config set project PROJECT_ID
Ersetzen Sie
PROJECT_ID
durch den Namen Ihres Google Cloud-Projekts.
-
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Aktivieren Sie die Vision API:
gcloud services enable vision.googleapis.com
-
Gewähren Sie Ihrem Google-Konto Rollen. Führen Sie den folgenden Befehl für jede der folgenden IAM-Rollen einmal aus:
roles/storage.objectViewer
gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
- Ersetzen Sie
PROJECT_ID
durch Ihre Projekt-ID. - Ersetzen Sie
EMAIL_ADDRESS
durch Ihre E-Mail-Adresse. - Ersetzen Sie
ROLE
durch jede einzelne Rolle.
- Ersetzen Sie
- Installieren Sie die Google Cloud CLI.
-
Führen Sie folgenden Befehl aus, um die gcloud CLI zu initialisieren:
gcloud init
-
Google Cloud-Projekt erstellen oder auswählen.
-
Erstellen Sie ein Google Cloud-Projekt:
gcloud projects create PROJECT_ID
Ersetzen Sie
PROJECT_ID
durch einen Namen für das Google Cloud-Projekt, das Sie erstellen. -
Wählen Sie das von Ihnen erstellte Google Cloud-Projekt aus:
gcloud config set project PROJECT_ID
Ersetzen Sie
PROJECT_ID
durch den Namen Ihres Google Cloud-Projekts.
-
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Aktivieren Sie die Vision API:
gcloud services enable vision.googleapis.com
-
Gewähren Sie Ihrem Google-Konto Rollen. Führen Sie den folgenden Befehl für jede der folgenden IAM-Rollen einmal aus:
roles/storage.objectViewer
gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
- Ersetzen Sie
PROJECT_ID
durch Ihre Projekt-ID. - Ersetzen Sie
EMAIL_ADDRESS
durch Ihre E-Mail-Adresse. - Ersetzen Sie
ROLE
durch jede einzelne Rolle.
- Ersetzen Sie
Anfrage zur Annotation eines Bildes stellen
Nachdem Sie die Schritte unter Hinweis abgeschlossen haben, können Sie die Vision API zum Annotieren einer Bilddatei verwenden.
In diesem Beispiel senden Sie mit curl eine Anfrage mit folgendem Bild an die Vision API:
Cloud Storage-URI:
gs://cloud-samples-data/vision/using_curl/shanghai.jpeg
HTTPS-URL:
https://console.cloud.google.com/storage/browser/cloud-samples-data/vision/using_curl/shanghai.jpeg
JSON-Anfrage erstellen
Die folgende request.json
-Datei zeigt, wie Sie drei images:annotate
-Elemente anfordern und die Ergebnisse in der Antwort begrenzen.
Erstellen Sie die JSON-Anfragedatei mit folgendem Text und speichern Sie sie als Nur-Text-Datei request.json
in Ihrem Arbeitsverzeichnis:
request.json
{ "requests": [ { "image": { "source": { "imageUri": "gs://cloud-samples-data/vision/using_curl/shanghai.jpeg" } }, "features": [ { "type": "LABEL_DETECTION", "maxResults": 3 }, { "type": "OBJECT_LOCALIZATION", "maxResults": 1 }, { "type": "TEXT_DETECTION", "maxResults": 1, "model": "builtin/latest" } ] } ] }
Anfrage senden
Sie verwenden curl und den Textinhalt von request.json
, um die Anfrage an die Vision API zu senden. Geben Sie Folgendes in die Befehlszeile ein:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "x-goog-user-project: PROJECT_ID" \ -H "Content-Type: application/json; charset=utf-8" \ https://vision.googleapis.com/v1/images:annotate -d @request.json
Antwort interpretieren
Sie sollten eine JSON-Antwort ähnlich wie diese sehen:
Der JSON-Text der Anfrage enthielt maxResults
für jeden Annotationstyp.
Daher sehen Sie in der JSON-Antwort dies:
- drei
labelAnnotations
-Ergebnisse - ein
textAnnotations
-Ergebnis (zur Verdeutlichung gekürzt) - ein
localizedObjectAnnotations
-Ergebnis
Ergebnisse der Labelerkennung
- description: "People", score: 0.950
- description: "Street", score: 0.891
- description: "Mode of transport", score: 0.890
Ergebnisse der Texterkennung
- Text: 牛牛面馆\n
- vertices: (x: 159, y: 212), (x: 947, y: 212), (x: 947, y: 354), (x: 159, y: 354)
Ergebnisse der Objekterkennung
- name: "Person", score: 0.944
- normalized vertices: (x: 0.260, y: 0.468), (x: 0.407, y: 0.468), (x: 0.407, y: 0.895), (x: 0.260, y: 0.895)
Das wars! Sie haben Ihre erste Anfrage an die Vision API gesendet.
Bereinigen
Löschen Sie das Google Cloud-Projekt mit den Ressourcen, damit Ihrem Google Cloud-Konto die auf dieser Seite verwendeten Ressourcen nicht in Rechnung gestellt werden.
Optional: Widerrufen Sie Anmeldedaten von der gcloud-CLI.
gcloud auth revoke
Nächste Schritte
- Alle Elementtypen und ihre Verwendung ansehen.
- Erste Schritte mit Vision API in der Sprache Ihrer Wahl. Verwenden Sie dafür eine Vision API-Clientbibliothek.
- Verwenden Sie die Anleitungen, um mehr über bestimmte Funktionen zu erfahren, Beispielannotationen anzusehen und Annotationen für einzelne Dateien oder Bilder abzurufen.
- Weitere Informationen zur Batch-Bild- und Datei-Annotationen (PDF/TIFF/GIF).
- Hier finden Sie eine vollständige Liste der Codebeispiele für die Clientbibliothek.