Package google.cloud.vision.v1p4beta1

Index

ImageAnnotator

Dienst, der Google Cloud Vision API-Erkennungsaufgaben für Kundenbilder durchführt, z. B. Gesichts-, Landmark-, Logo-, Label- und Texterkennung. Der ImageAnnotator-Dienst liefert erkannte Entitäten aus den Bildern.

AsyncBatchAnnotateFiles

rpc AsyncBatchAnnotateFiles(AsyncBatchAnnotateFilesRequest) returns (Operation)

Führen Sie die asynchrone Bilderkennung und -annotation für eine Liste allgemeiner Dateien aus, z. B. PDF-Dateien, die mehrere Seiten und mehrere Bilder pro Seite enthalten können. Fortschritt und Ergebnisse können über die google.longrunning.Operations-Schnittstelle abgerufen werden. Operation.metadata enthält OperationMetadata (Metadaten). Operation.response enthält AsyncBatchAnnotateFilesResponse (Ergebnisse).

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AsyncBatchAnnotateImages

rpc AsyncBatchAnnotateImages(AsyncBatchAnnotateImagesRequest) returns (Operation)

Führen Sie die asynchrone Bilderkennung und -annotation für eine Liste von Bildern aus.

Fortschritt und Ergebnisse können über die google.longrunning.Operations-Schnittstelle abgerufen werden. Operation.metadata enthält OperationMetadata (Metadaten). Operation.response enthält AsyncBatchAnnotateImagesResponse (Ergebnisse).

Dieser Dienst schreibt Ausgaben von Anmerkungsbildern in JSON-Dateien im Google Cloud Storage-Bucket des Kunden, und zwar jede JSON-Datei, die BatchAnnotateImagesResponse.proto enthält.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

BatchAnnotateFiles

rpc BatchAnnotateFiles(BatchAnnotateFilesRequest) returns (BatchAnnotateFilesResponse)

Dienst, der für einen Batch von Dateien Bilderkennung und -annotation ausführt. Jetzt werden nur „application/pdf“, „image/tiff“ und „image/gif“ unterstützt.

Dieser Dienst extrahiert maximal fünf (Kunden können angeben, welche fünf in AnnotateFileRequest.pages) Frames (gif) oder Seiten (PDF oder TIFF) aus jeder bereitgestellten Datei enthalten sind. Für jedes extrahierte Bild werden Erkennung und Annotation durchgeführt.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

BatchAnnotateImages

rpc BatchAnnotateImages(BatchAnnotateImagesRequest) returns (BatchAnnotateImagesResponse)

Führen Sie Bilderkennung und -anmerkung für einen Satz von Bildern aus.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

Produktsuche

Verwaltet Produkte und Produktgruppen von Referenzbildern für die Produktsuche. Dabei wird das folgende Ressourcenmodell verwendet:

  • Die API verfügt über eine Sammlung von ProductSet-Ressourcen mit dem Namen projects/*/locations/*/productSets/*, mit denen verschiedene Produkte in Gruppen unterteilt werden können, um die Identifizierung einzuschränken.

Parallel

  • Die API verfügt über eine Sammlung von Product-Ressourcen mit dem Namen projects/*/locations/*/products/*.

  • Jede Product hat eine Sammlung von ReferenceImage-Ressourcen namens projects/*/locations/*/products/*/referenceImages/*.

AddProductToProductSet

rpc AddProductToProductSet(AddProductToProductSetRequest) returns (Empty)

Fügt ein Produkt zur angegebenen Produktgruppe hinzu. Wenn das Produkt bereits vorhanden ist, wird keine Änderung vorgenommen.

Ein Produkt kann maximal 100 Produktgruppen hinzugefügt werden.

Mögliche Fehler:

  • Gibt NOT_FOUND zurück, wenn das Produkt oder die Produktgruppe nicht vorhanden ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

CreateProduct

rpc CreateProduct(CreateProductRequest) returns (Product)

Erstellt eine neue Produktressource und gibt diese zurück.

Mögliche Fehler:

  • Gibt INVALID_ARGUMENT zurück, wenn der angezeigte Name fehlt oder länger als 4.096 Zeichen ist.
  • Gibt INVALID_ARGUMENT zurück, wenn die Beschreibung länger als 4096 Zeichen ist.
  • Gibt INVALID_ARGUMENT zurück, wenn product_category fehlt oder ungültig ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

CreateProductSet

rpc CreateProductSet(CreateProductSetRequest) returns (ProductSet)

Erstellt eine neue ProductSet-Ressource und gibt sie zurück.

Mögliche Fehler:

  • Gibt INVALID_ARGUMENT zurück, wenn der angezeigte Name fehlt oder länger als 4.096 Zeichen ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

CreateReferenceImage

rpc CreateReferenceImage(CreateReferenceImageRequest) returns (ReferenceImage)

Erstellt eine neue ReferenceImage-Ressource und gibt diese zurück.

Das Feld bounding_poly ist optional. Wenn bounding_poly nicht angegeben ist, versucht das System, interessante Regionen im Bild zu erkennen, die mit der „product_category“ im übergeordneten Produkt kompatibel sind. Ist er angegeben, wird die Erkennung IMMER übersprungen. Das System wandelt Polygone in nicht gedrehte Rechtecke um.

Beachten Sie, dass die Pipeline die Größe des Bilds ändert, wenn es zu groß ist, um es zu verarbeiten (über 50 MP).

Mögliche Fehler:

  • Gibt INVALID_ARGUMENT zurück, wenn image_uri fehlt oder länger als 4.096 Zeichen ist.
  • Gibt INVALID_ARGUMENT zurück, wenn das Produkt nicht vorhanden ist.
  • Gibt INVALID_ARGUMENT zurück, wenn bounding_poly nicht angegeben ist und keine mit der product_category des übergeordneten Produkts erkannt wird.
  • Gibt INVALID_ARGUMENT zurück, wenn bounding_poly mehr als 10 Polygone enthält.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

DeleteProduct

rpc DeleteProduct(DeleteProductRequest) returns (Empty)

Löscht ein Produkt und seine Referenzbilder endgültig.

Die Metadaten des Produkts und aller zugehörigen Bilder werden sofort gelöscht. Suchanfragen mit Produktsets, die das Produkt enthalten, funktionieren jedoch möglicherweise weiterhin, bis alle zugehörigen Caches aktualisiert wurden.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

DeleteProductSet

rpc DeleteProductSet(DeleteProductSetRequest) returns (Empty)

Löscht eine Produktgruppe endgültig. Produkte und Referenzbilder in der Produktgruppe werden nicht gelöscht.

Die tatsächlichen Bilddateien werden nicht aus Google Cloud Storage gelöscht.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

DeleteReferenceImage

rpc DeleteReferenceImage(DeleteReferenceImageRequest) returns (Empty)

Löscht ein Referenzbild endgültig.

Die Metadaten des Bildes werden sofort gelöscht. Suchanfragen an Produktsets, die das Bild enthalten, funktionieren jedoch möglicherweise weiterhin, bis alle zugehörigen Caches aktualisiert wurden.

Die tatsächlichen Bilddateien werden nicht aus Google Cloud Storage gelöscht.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

GetProduct

rpc GetProduct(GetProductRequest) returns (Product)

Ruft Informationen zu einem Produkt ab.

Mögliche Fehler:

  • Wenn das Produkt nicht existiert, wird NOT_FOUND ausgegeben.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

GetProductSet

rpc GetProductSet(GetProductSetRequest) returns (ProductSet)

Ruft Informationen zu einem ProductSet ab.

Mögliche Fehler:

  • Wenn das ProductSet nicht existiert, wird NOT_FOUND ausgegeben.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

GetReferenceImage

rpc GetReferenceImage(GetReferenceImageRequest) returns (ReferenceImage)

Ruft Informationen zu einem ReferenceImage ab.

Mögliche Fehler:

  • Gibt NOT_FOUND zurück, wenn das angegebene Image nicht vorhanden ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ImportProductSets

rpc ImportProductSets(ImportProductSetsRequest) returns (Operation)

Asynchrone API, die basierend auf einer Liste von Bildinformationen eine Liste von Referenzbildern in bestimmte Produktgruppen importiert.

Mit der google.longrunning.Operation API können Sie den Fortschritt und die Ergebnisse der Anfrage verfolgen. Operation.metadata enthält BatchOperationMetadata. (Fortschritt) Operation.response enthält ImportProductSetsResponse. (Ergebnisse)

Die Eingabequelle dieser Methode ist eine CSV-Datei in Google Cloud Storage. Das Format der CSV-Datei finden Sie unter ImportProductSetsGcsSource.csv_file_uri.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ListProductSets

rpc ListProductSets(ListProductSetsRequest) returns (ListProductSetsResponse)

Listet Produktgruppen auf eine nicht spezifizierte Reihenfolge auf.

Mögliche Fehler:

  • Gibt INVALID_ARGUMENT zurück, wenn page_size größer als 100 oder kleiner als 1 ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ListProducts

rpc ListProducts(ListProductsRequest) returns (ListProductsResponse)

Listet Produkte in nicht spezifizierter Reihenfolge auf.

Mögliche Fehler:

  • Gibt INVALID_ARGUMENT zurück, wenn page_size größer als 100 oder kleiner als 1 ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ListProductsInProductSet

rpc ListProductsInProductSet(ListProductsInProductSetRequest) returns (ListProductsInProductSetResponse)

Listet die Produkte in einer nicht definierten Reihenfolge auf. Wenn das Produktset nicht vorhanden ist, ist das Feld „products“ der Antwort leer.

Mögliche Fehler:

  • Gibt INVALID_ARGUMENT zurück, wenn page_size größer als 100 oder kleiner als 1 ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

ListReferenceImages

rpc ListReferenceImages(ListReferenceImagesRequest) returns (ListReferenceImagesResponse)

Listet Referenzbilder auf.

Mögliche Fehler:

  • Gibt NOT_FOUND zurück, wenn das übergeordnete Produkt nicht vorhanden ist.
  • Gibt INVALID_ARGUMENT zurück, wenn die page_size größer als 100 oder kleiner als 1 ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

RemoveProductFromProductSet

rpc RemoveProductFromProductSet(RemoveProductFromProductSetRequest) returns (Empty)

Entfernt ein Produkt aus dem angegebenen ProductSet.

Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

UpdateProduct

rpc UpdateProduct(UpdateProductRequest) returns (Product)

Änderungen an einer Produktressource vornehmen. Derzeit können nur die Felder display_name, description und labels aktualisiert werden.

Wenn Labels aktualisiert werden, wird die Änderung erst nach der nächsten Indexzeit in Abfragen berücksichtigt.

Mögliche Fehler:

  • Wenn das Produkt nicht existiert, wird NOT_FOUND ausgegeben.
  • Gibt INVALID_ARGUMENT zurück, wenn display_name in update_mask vorhanden ist, aber in der Anfrage fehlt oder länger als 4.096 Zeichen ist.
  • Gibt INVALID_ARGUMENT zurück, wenn die Beschreibung in update_mask vorhanden ist, aber länger als 4.096 Zeichen ist.
  • Gibt INVALID_ARGUMENT zurück, wenn product_category in update_mask vorhanden ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

UpdateProductSet

rpc UpdateProductSet(UpdateProductSetRequest) returns (ProductSet)

Änderungen an einer ProductSet-Ressource vornehmen. Derzeit kann nur display_name aktualisiert werden.

Mögliche Fehler:

  • Wenn das ProductSet nicht existiert, wird NOT_FOUND ausgegeben.
  • Gibt INVALID_ARGUMENT zurück, wenn display_name in update_mask vorhanden ist, aber in der Anfrage fehlt oder länger als 4.096 Zeichen ist.
Autorisierungsbereiche

Erfordert einen der folgenden OAuth-Bereiche:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Weitere Informationen finden Sie in der Authentifizierungsübersicht.

AddProductToProductSetRequest

Anfragenachricht für die Methode AddProductToProductSet.

Felder
name

string

Der Ressourcenname des zu ändernden ProductSets.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

product

string

Der Ressourcenname des Produkts, das zu diesem ProductSet hinzugefügt werden soll.

Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

AnnotateFileRequest

Eine Anfrage zum Annotieren einer einzelnen Datei, z. B. einer PDF-, TIFF- oder GIF-Datei.

Felder
input_config

InputConfig

Erforderlich. Informationen zur Eingabedatei.

features[]

Feature

Erforderlich. Die angeforderten Funktionen

image_context

ImageContext

Zusätzlicher Kontext, der gegebenenfalls die Bilder in der Datei enthält

pages[]

int32

Seiten der Datei, die eine Bildanmerkung ausführt.

Die Seiten beginnen bei 1. Wir gehen davon aus, dass die erste Seite der Datei Seite 1 ist. Pro Anfrage werden maximal 5 Seiten unterstützt. Seiten können negativ sein.

Seite 1 steht für die erste Seite. Seite 2 steht für die zweite Seite. Seite 1 bedeutet die letzte Seite. Seite 2 bedeutet, dass die zweite Seite die letzte ist.

Wenn die Datei das GIF-Format anstelle von PDF oder TIFF darstellt, bezieht sich die Seite auf GIF-Frames.

Wenn dieses Feld leer ist, führt der Dienst standardmäßig eine Bildanmerkung für die ersten fünf Seiten der Datei aus.

AnnotateFileResponse

Antwort auf eine einzelne Dateiannotationsanfrage Eine Datei kann ein oder mehrere Bilder enthalten, die jeweils eigene Antworten haben.

Felder
input_config

InputConfig

Informationen zur Datei, für die diese Antwort generiert wird.

responses[]

AnnotateImageResponse

Einzelne Antworten auf Bilder in der Datei.

total_pages

int32

Dieses Feld gibt die Gesamtzahl der Seiten in der Datei an.

AnnotateImageRequest

Anfrage zum Ausführen von Google Cloud Vision API-Aufgaben für ein von Nutzern bereitgestelltes Bild mit von Nutzern angeforderten Funktionen und Kontextinformationen.

Felder
image

Image

Das zu verarbeitende Bild

features[]

Feature

Die angeforderten Funktionen

image_context

ImageContext

Zusätzlicher Kontext, den das Bild umfassen kann

AnnotateImageResponse

Antworten auf eine Bildanmerkungsanfrage

Felder
face_annotations[]

FaceAnnotation

Falls vorhanden, wurde die Gesichtserkennung erfolgreich abgeschlossen.

landmark_annotations[]

EntityAnnotation

Falls vorhanden, wurde die Landmark-Erkennung erfolgreich abgeschlossen.

logo_annotations[]

EntityAnnotation

Falls vorhanden, wurde die Logoerkennung erfolgreich abgeschlossen.

label_annotations[]

EntityAnnotation

Falls vorhanden, wurde die Labelerkennung erfolgreich abgeschlossen.

localized_object_annotations[]

LocalizedObjectAnnotation

Falls vorhanden, wurde die Objekterkennung erfolgreich abgeschlossen. Diese Sortierung wird absteigend nach Konfidenzwert sortiert.

text_annotations[]

EntityAnnotation

Falls vorhanden, wurde die Texterkennung (OCR) erfolgreich abgeschlossen.

full_text_annotation

TextAnnotation

Falls vorhanden, wurde die Erkennung von Text (OCR) oder Dokumenttext (OCR) erfolgreich abgeschlossen. Diese Anmerkung stellt die strukturelle Hierarchie für den OCR-Erkennungstext bereit.

safe_search_annotation

SafeSearchAnnotation

Falls vorhanden, wurde die SafeSearch-Anmerkung erfolgreich abgeschlossen.

image_properties_annotation

ImageProperties

Falls vorhanden, wurden Bildeigenschaften erfolgreich extrahiert.

crop_hints_annotation

CropHintsAnnotation

Falls vorhanden, wurden Zuschneidehinweise erfolgreich abgeschlossen.

web_detection

WebDetection

Falls vorhanden, wurde die Weberkennung erfolgreich abgeschlossen.

product_search_results

ProductSearchResults

Falls vorhanden, wurde die Produktsuche erfolgreich abgeschlossen.

error

Status

Die Fehlermeldung für den Vorgang, falls diese festgelegt ist. Beachten Sie, dass die eingetragenen Bildanmerkungen garantiert korrekt sind, auch wenn ein error angezeigt wird.

context

ImageAnnotationContext

Falls vorhanden, sind Kontextinformationen erforderlich, um zu verstehen, woher dieses Bild stammt.

AsyncAnnotateFileRequest

Eine Anfrage für eine Offline-Dateiannotation.

Felder
input_config

InputConfig

Erforderlich. Informationen zur Eingabedatei.

features[]

Feature

Erforderlich. Die angeforderten Funktionen

image_context

ImageContext

Zusätzlicher Kontext, der gegebenenfalls die Bilder in der Datei enthält

output_config

OutputConfig

Erforderlich. Der gewünschte Speicherort und die gewünschten Metadaten der Ausgabe (z. B. Format).

AsyncAnnotateFileResponse

Die Antwort auf eine einzelne Anmerkung einer Offlinedatei.

Felder
output_config

OutputConfig

Der Speicherort und die Metadaten der AsyncAnnotateFileRequest.

AsyncBatchAnnotateFilesRequest

Mehrere Anfragen für asynchrone Dateiannotationen werden in einem einzigen Dienstaufruf zusammengefasst.

Felder
requests[]

AsyncAnnotateFileRequest

Individuelle asynchrone Dateiannotationsanfragen für diesen Batch.

AsyncBatchAnnotateFilesResponse

Antwort auf eine asynchrone Batchanfrage zur Annotation von Batchdateien.

Felder
responses[]

AsyncAnnotateFileResponse

Die Liste der Antworten zur Dateiannotation, eine für jede Anfrage in AsyncBatchAnnotateFilesRequest.

AsyncBatchAnnotateImagesRequest

Anfrage für asynchrone Bildannotation für eine Liste von Bildern.

Felder
requests[]

AnnotateImageRequest

Individuelle Bildanmerkungsanfragen für diesen Satz

output_config

OutputConfig

Erforderlich. Der gewünschte Speicherort und die gewünschten Metadaten der Ausgabe (z. B. Format).

AsyncBatchAnnotateImagesResponse

Antwort auf eine Anfrage zur asynchronen Batchannotation für Bilder

Felder
output_config

OutputConfig

Der Speicherort und die Metadaten der AsyncBatchAnnotateImagesRequest.

BatchAnnotateFilesRequest

Eine Liste mit Anfragen zum Annotieren von Dateien mithilfe der BatchAnnotateFiles API.

Felder
requests[]

AnnotateFileRequest

Die Liste der Anfrageanmerkungsanfragen Derzeit unterstützen wir in BatchAnnotateFilesRequest nur eine AnnotateFileRequest.

BatchAnnotateFilesResponse

Eine Liste von Antworten zu Dateiannotationen.

Felder
responses[]

AnnotateFileResponse

Die Liste der Antworten zur Dateiannotation, wobei jede Antwort für jede AnnotateFileRequest in BatchAnnotateFilesRequest entspricht.

BatchAnnotateImagesRequest

Mehrere Bildanmerkungsanfragen werden in einem einzelnen Dienstaufruf zusammengefasst.

Felder
requests[]

AnnotateImageRequest

Individuelle Bildanmerkungsanfragen für diesen Satz

BatchAnnotateImagesResponse

Antwort auf eine Anmerkungsanfrage für Sätze von Bildern

Felder
responses[]

AnnotateImageResponse

Individuelle Antworten auf Bildanmerkungsanfragen innerhalb des Satzes

BatchOperationMetadata

Metadaten für Batchvorgänge wie den aktuellen Status

Dies ist im Feld metadata von Operation enthalten, das durch den Aufruf GetOperation des google::longrunning::Operations-Dienstes zurückgegeben wird.

Felder
state
(deprecated)

State

Der aktuelle Status des Batchvorgangs

submit_time

Timestamp

Der Zeitpunkt, zu dem die Batchanfrage an den Server gesendet wurde.

end_time

Timestamp

Der Zeitpunkt, zu dem die Batchanfrage beendet und google.longrunning.Operation.done auf „true“ gesetzt wurde.

Zustandsorientiert

Zählt die möglichen Statusangaben auf, die die Batchanfrage aufweisen kann.

Enums
STATE_UNSPECIFIED Ungültig
PROCESSING Die Anfrage wird aktiv verarbeitet.
SUCCESSFUL Die Anfrage ist abgeschlossen und mindestens ein Element wurde erfolgreich verarbeitet.
FAILED Die Anfrage ist abgeschlossen und es wurde kein Artikel verarbeitet.
CANCELLED Die Anfrage wurde ausgeführt, nachdem der Nutzer longrunning.Operations.CancelOperation aufgerufen hat. Alle Datensätze, die vor dem Abbruchbefehl verarbeitet wurden, werden wie in der Anfrage angegeben ausgegeben.

Blockieren

Logisches Element auf der Seite

Felder
property

TextProperty

Zusätzliche für den Block erkannte Informationen

bounding_box

BoundingPoly

Der Begrenzungsrahmen für den Block. Die Eckpunkte werden in der Reihenfolge von oben links, rechts oben, rechts unten und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition des Lesens des Texts in „natürlicher“ Ausrichtung. Beispiel:

  • Wenn der Text horizontal ist, könnte er so aussehen:
    0----1
    |    |
    3----2
  • wenn er um 180 Grad um die linke obere Ecke gedreht wird, wird daraus:
    2----3
    |    |
    1----0

und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).

paragraphs[]

Paragraph

Liste der Absätze in diesem Block (wenn der Block den Typ "Text" hat)

block_type

BlockType

Erkannter Blocktyp (Text, Bild usw.) für diesen Block

confidence

float

Die Konfidenz der OCR-Ergebnisse für den Block. Bereich [0, 1].

BlockType

Typ eines Blocks (Text, Bild usw.), der durch OCR identifiziert wurde.

Enums
UNKNOWN Unbekannter Blocktyp
TEXT Normaler Textblock
TABLE Tabellenblock
PICTURE Bildblock
RULER Feld mit horizontaler/vertikaler Linie
BARCODE Barcodeblock

BoundingPoly

Ein Begrenzungspolygon für die erkannte Bildanmerkung

Felder
vertices[]

Vertex

Die Eckpunkte des Begrenzungspolygons

normalized_vertices[]

NormalizedVertex

Das Eckpolygon normalisierte Eckpunkte.

ColorInfo

Die Farbinformationen umfassen RGB-Kanäle, den Wert sowie den Anteil des Bildes, den die jeweilige Farbe einnimmt.

Felder
color

Color

RGB-Komponenten der Farbe

score

float

Bildspezifischer Wert für diese Farbe. Wert im Bereich [0, 1].

pixel_fraction

float

Der Anteil der Pixel, die die jeweilige Farbe im Bild belegt. Wert im Bereich [0, 1].

CreateProductRequest

Anfragenachricht für die Methode CreateProduct.

Felder
parent

string

Das Projekt, in dem das Produkt erstellt werden soll.

Format ist projects/PROJECT_ID/locations/LOC_ID.

product

Product

Das zu erstellende Produkt.

product_id

string

Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses Produkt. Wenn festgelegt, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen enthalten Er darf das Zeichen / nicht enthalten.

CreateProductSetRequest

Anfragenachricht für die Methode CreateProductSet.

Felder
parent

string

Das Projekt, in dem das ProductSet erstellt werden soll.

Format ist projects/PROJECT_ID/locations/LOC_ID.

product_set

ProductSet

Die zu erstellende Produktgruppe.

product_set_id

string

Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses ProduktSet. Wenn festgelegt, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen enthalten Er darf das Zeichen / nicht enthalten.

CreateReferenceImageRequest

Anfragenachricht für die Methode CreateReferenceImage.

Felder
parent

string

Ressourcenname des Produkts, in dem das Referenzbild erstellt werden soll.

Format ist projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

reference_image

ReferenceImage

Das zu erstellende Referenzbild. Wenn eine Bild-ID angegeben wird, wird sie ignoriert.

reference_image_id

string

Eine vom Nutzer bereitgestellte Ressourcen-ID für das ReferenceImage, das hinzugefügt werden soll. Wenn festgelegt, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen enthalten Er darf das Zeichen / nicht enthalten.

CropHint

Einzelner Zuschneidehinweis, der zum Generieren eines neuen Zuschneidevorgangs beim Verarbeiten eines Bildes verwendet wird.

Felder
bounding_poly

BoundingPoly

Das Begrenzungspolygon für den Zuschnittsbereich. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds.

confidence

float

Die Konfidenz, dass dies ein auffälliger Bereich ist. Bereich [0, 1].

importance_fraction

float

Anteil der Bedeutung dieses auffälligen Bereichs in Bezug auf das Originalbild.

CropHintsAnnotation

Ein Satz von Zuschneidehinweisen, die zum Generieren neuer Zuschneidevorgänge beim Verarbeiten von Bildern verwendet werden.

Felder
crop_hints[]

CropHint

Ergebnisse der Zuschneidehinweise

CropHintsParams

Parameter für Anmerkungsanfrage zu Zuschneidehinweisen

Felder
aspect_ratios[]

float

Seitenverhältnisse in Gleitkommazahlen, die das Verhältnis von Breite zu Höhe des Bildes darstellen. Wenn das gewünschte Seitenverhältnis beispielsweise 4:3 ist, sollte der entsprechende Gleitkommawert 1,33333 betragen. Wenn nichts angegeben ist, wird der bestmögliche Zuschnitt geliefert. Die Anzahl der bereitgestellten Seitenverhältnisse ist auf maximal 16 begrenzt; alle nach dem 16. Seitenverhältnis angegebenen Seitenverhältnisse werden ignoriert.

DeleteProductRequest

Anfragenachricht für die Methode DeleteProduct.

Felder
name

string

Ressourcenname des zu löschenden Produkts.

Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

DeleteProductSetRequest

Anfragenachricht für die Methode DeleteProductSet.

Felder
name

string

Ressourcenname des zu löschenden ProductSet.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

DeleteReferenceImageRequest

Anfragenachricht für die Methode DeleteReferenceImage.

Felder
name

string

Der Ressourcenname des zu löschenden Referenzbilds.

Format ist:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID

DominantColorsAnnotation

Satz dominierender Farben und ihre entsprechenden Werte

Felder
colors[]

ColorInfo

RGB-Farbwerte mit ihren Werten und ihrem Pixelanteil

EntityAnnotation

Satz erkannter Entitätsmerkmale

Felder
mid

string

Intransparente Entitäts-ID. Einige IDs sind möglicherweise in Google Knowledge Graph Search API verfügbar.

locale

string

Der Sprachcode für die Sprache, in der die Entität description geschrieben wurde.

description

string

Entitätstextbeschreibungen in ihrer locale-Sprache

score

float

Gesamtwert des Ergebnisses. Bereich [0, 1].

confidence
(deprecated)

float

Eingestellt. Verwenden Sie stattdessen score. Die Genauigkeit der Entitätserkennung in einem Bild. Beispielsweise stellt bei einem Bild, in dem die Entität "Eiffelturm" erkannt wird, dieses Feld die Konfidenz dar, dass sich im Abfragebild ein Turm befindet. Bereich [0, 1].

topicality

float

Die Relevanz des ICA-Labels (Image Content Annotation) für das Bild. Zum Beispiel ist die Relevanz von "Turm" für ein Bild, das den erkannten "Eiffelturm" enthält, wahrscheinlich höher als für ein Bild, das ein erkanntes entferntes, hoch aufragendes Gebäude enthält. Dabei kann die Konfidenz, dass es in jedem Bild einen Turm gibt, gleich sein. Bereich [0, 1].

bounding_poly

BoundingPoly

Bildbereich, zu dem diese Entität gehört. Nicht für LABEL_DETECTION-Funktionen erstellt.

locations[]

LocationInfo

Die Standortinformation für die erkannte Entität. Es können mehrere LocationInfo-Elemente vorhanden sein, da ein Ort den Standort der Szene im Bild angeben kann und ein anderer den Ort, an dem das Bild aufgenommen wurde. Standortinformationen sind normalerweise für Sehenswürdigkeiten vorhanden.

properties[]

Property

Einige Entitäten verfügen möglicherweise über optionale, vom Nutzer angegebene Property-Felder (Name/Wert), z. B. einen Wert oder einen String, der die Entität qualifiziert.

FaceAnnotation

Ein Gesichtsanmerkungsobjekt enthält die Ergebnisse der Gesichtserkennung.

Felder
bounding_poly

BoundingPoly

Das Begrenzungspolygon um das Gesicht. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds. Der Begrenzungsrahmen wird so berechnet, dass er das Gesicht entsprechend den menschlichen Erwartungen "einrahmt". Es basiert auf den Landmark-Ergebnissen. Es kann vorkommen, dass eine oder mehrere x- und/oder y-Koordinaten im BoundingPoly nicht generiert werden (das Polygon ist unbegrenzt), wenn nur ein teilweises Gesicht im Bild annotiert wird.

fd_bounding_poly

BoundingPoly

Das fd_bounding_poly-Begrenzungsrahmen ist enger als der boundingPoly und umschließt nur den Hautteil des Gesichts. In der Regel wird es verwendet, um das Gesicht von einer Bildanalyse zu eliminieren, die die „Menge an Haut“ erkennt, die in einem Bild sichtbar ist. Es basiert nicht auf den Landmark-Ergebnissen, sondern nur auf der anfänglichen Gesichtserkennung; deshalb das Präfix

fd

(face detection, Gesichtserkennung).

landmarks[]

Landmark

Erkannte markante Stellen im Gesicht (Landmarks).

roll_angle

float

Rollwinkel, der den Betrag der Drehung des Gesichts im Uhrzeigersinn/gegen den Uhrzeigersinn relativ zur senkrechten Achse des Bildes um die Achse senkrecht zum Gesicht angibt. Bereich [-180,180].

pan_angle

float

Schiebewinkel, der den nach links/rechts gerichteten Winkel des Gesichts relativ zur vertikalen Ebene senkrecht zum Bild anzeigt. Bereich [-180,180].

tilt_angle

float

Neigungswinkel, der den Aufwärts-/Abwärtswinkel des Gesichts relativ zur horizontalen Ebene des Bildes anzeigt. Bereich [-180,180].

detection_confidence

float

Erkennungskonfidenz. Bereich [0, 1].

landmarking_confidence

float

Gesichts-Landmark-Konfidenz. Bereich [0, 1].

joy_likelihood

Likelihood

Wahrscheinlichkeit für Freude.

sorrow_likelihood

Likelihood

Wahrscheinlichkeit für Kummer.

anger_likelihood

Likelihood

Wahrscheinlichkeit für Wut.

surprise_likelihood

Likelihood

Wahrscheinlichkeit für Überraschung.

under_exposed_likelihood

Likelihood

Wahrscheinlichkeit für unterbelichtetes Foto.

blurred_likelihood

Likelihood

Wahrscheinlichkeit für unscharfes Foto.

headwear_likelihood

Likelihood

Wahrscheinlichkeit für Kopfbedeckung.

Landmark

Eine gesichtsspezifische markante Stelle (z. B. ein Gesichtsmerkmal).

Felder
type

Type

Gesichts-Landmark-Typ

position

Position

Gesichts-Landmark-Position

Typ

Gesichts-Landmark-Typ (Gesichtsmerkmaltyp). Links und rechts werden aus der Sicht des Betrachters des Bildes definiert, ohne Spiegelprojektionen zu berücksichtigen, die für Fotos typisch sind. Deshalb ist LEFT_EYE typischerweise das rechte Auge der Person.

Enums
UNKNOWN_LANDMARK Unbekannte Gesichts-Landmark erkannt. Sollte nicht ausgefüllt sein.
LEFT_EYE Linkes Auge
RIGHT_EYE Rechtes Auge
LEFT_OF_LEFT_EYEBROW Links von der linken Augenbraue
RIGHT_OF_LEFT_EYEBROW Rechte von der linken Augenbraue
LEFT_OF_RIGHT_EYEBROW Linke von der rechten Augenbraue
RIGHT_OF_RIGHT_EYEBROW Rechts von der rechten Augenbraue
MIDPOINT_BETWEEN_EYES Mittelpunkt zwischen den Augen
NOSE_TIP Nasenspitze
UPPER_LIP Oberlippe
LOWER_LIP Unterlippe
MOUTH_LEFT Mund links
MOUTH_RIGHT Mund rechts
MOUTH_CENTER Mundmitte
NOSE_BOTTOM_RIGHT Nase, unten rechts
NOSE_BOTTOM_LEFT Nase, unten links
NOSE_BOTTOM_CENTER Nase, unten Mitte
LEFT_EYE_TOP_BOUNDARY Linkes Auge, obere Begrenzung
LEFT_EYE_RIGHT_CORNER Linkes Auge, rechte Ecke
LEFT_EYE_BOTTOM_BOUNDARY Linkes Auge, untere Begrenzung
LEFT_EYE_LEFT_CORNER Linkes Auge, linke Ecke
RIGHT_EYE_TOP_BOUNDARY Rechtes Auge, obere Begrenzung
RIGHT_EYE_RIGHT_CORNER Rechtes Auge, rechte Ecke
RIGHT_EYE_BOTTOM_BOUNDARY Rechtes Auge, untere Begrenzung
RIGHT_EYE_LEFT_CORNER Rechtes Auge, linke Ecke
LEFT_EYEBROW_UPPER_MIDPOINT Linke Augenbraue, oberer Mittelpunkt
RIGHT_EYEBROW_UPPER_MIDPOINT Rechte Augenbraue, oberer Mittelpunkt
LEFT_EAR_TRAGION Tragion linkes Ohr
RIGHT_EAR_TRAGION Tragion rechtes Ohr
LEFT_EYE_PUPIL Pupille linkes Auge
RIGHT_EYE_PUPIL Pupille rechtes Auge
FOREHEAD_GLABELLA Glabella Stirn
CHIN_GNATHION Gnathion Kinn
CHIN_LEFT_GONION Kinn, linker Gonion
CHIN_RIGHT_GONION Kinn, rechter Gonion

Feature

Der Typ der durchzuführenden Google Cloud Vision API-Erkennung und die maximale Anzahl von Ergebnissen, die für diesen Typ zurückgegeben werden sollen. In der Liste features können mehrere Feature-Objekte angegeben werden.

Felder
type

Type

Funktionstyp

max_results

int32

Maximale Anzahl von Ergebnissen dieses Typs Gilt nicht für TEXT_DETECTION, DOCUMENT_TEXT_DETECTION oder CROP_HINTS.

model

string

Das für die Funktion zu verwendende Modell. Unterstützte Werte: "builtin/stable" (Standardeinstellung, wenn nicht festgelegt) und "builtin/latest".

Typ

Typ der Google Cloud Vision API-Funktion, die extrahiert werden soll.

Enums
TYPE_UNSPECIFIED Nicht angegebener Funktionstyp
FACE_DETECTION Gesichtserkennung ausführen
LANDMARK_DETECTION Landmark-Erkennung ausführen
LOGO_DETECTION Logoerkennung ausführen
LABEL_DETECTION Labelerkennung ausführen
TEXT_DETECTION Texterkennung/Optische Zeichenerkennung (OCR) ausführen Die Texterkennung ist für Textbereiche in einem größeren Bild optimiert. Wenn das Bild ein Dokument ist, verwenden Sie stattdessen DOCUMENT_TEXT_DETECTION.
DOCUMENT_TEXT_DETECTION OCR für Dokument mit dichtem Text ausführen. Hat Vorrang, wenn DOCUMENT_TEXT_DETECTION und TEXT_DETECTION vorhanden sind.
SAFE_SEARCH_DETECTION Führen Sie SafeSearch aus, um potenziell unsichere oder unerwünschte Inhalte zu erkennen.
IMAGE_PROPERTIES Eine Reihe von Bildeigenschaften berechnen, z. B. die dominanten Farben des Bildes.
CROP_HINTS Zuschneidehinweise ausführen
WEB_DETECTION Weberkennung ausführen
OBJECT_LOCALIZATION Führen Sie den Localizer für die Objekterkennung aus.

GcsDestination

Der Google Cloud Storage-Speicherort, in den die Ausgabe geschrieben wird.

Felder
uri

string

Google Cloud Storage-URI-Präfix, in dem die Ergebnisse gespeichert werden. Die Ergebnisse haben das JSON-Format und das zugehörige Präfix des Eingabe-URI. Dieses Feld kann entweder ein Google Cloud Storage-Dateipräfix oder ein Google Cloud Storage-Verzeichnis darstellen. In beiden Fällen sollte der URI eindeutig sein, da Sie zum Abrufen aller Ausgabedateien eine Platzhaltersuche in Google Cloud Storage für das von Ihnen angegebene URI-Präfix durchführen müssen.

Beispiele:

Bei mehreren Ausgaben enthält jede Antwort immer noch AnnotateFileResponse, die jeweils einen Teil der vollständigen Liste von AnnotateImageResponse enthält. Mehrere Ausgaben können auftreten, wenn die JSON-Ausgabe beispielsweise zu groß ist und in mehrere fragmentierte Dateien überläuft.

GcsSource

Der Google Cloud Storage-Speicherort, aus dem die Eingabe gelesen wird.

Felder
uri

string

Google Cloud Storage-URI für die Eingabedatei. Dies muss nur ein Google Cloud Storage-Objekt sein. Platzhalter werden derzeit nicht unterstützt.

GetProductRequest

Anfragenachricht für die Methode GetProduct.

Felder
name

string

Ressourcenname des abzurufenden Produkts.

Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

GetProductSetRequest

Anfragenachricht für die Methode GetProductSet.

Felder
name

string

Ressourcenname des abzurufenden ProductSet.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

GetReferenceImageRequest

Anfragenachricht für die Methode GetReferenceImage.

Felder
name

string

Der Ressourcenname des abzurufenden ReferenceImage.

Format ist:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID.

Bild

Kundenbild, für das Google Cloud Vision API-Aufgaben ausgeführt werden sollen

Felder
content

bytes

Bildinhalt, dargestellt als ein Stream von Byte. Hinweis: Wie bei allen bytes-Feldern verwenden auch Protokollpuffer eine reine Binärdarstellung, während JSON-Darstellungen Base64 verwenden.

source

ImageSource

Google Cloud Storage-Bildspeicherort oder öffentlich zugängliche Bild-URL Wenn sowohl ein content als auch source für ein Bild angegeben sind, hat content Vorrang und wird zur Anfrage der Bildanmerkung verwendet.

ImageAnnotationContext

Wenn ein Bild aus einer Datei (z. B. einer PDF-Datei) erstellt wurde, enthält diese Nachricht Informationen zur Quelle des Bildes.

Felder
uri

string

Der URI der Datei, die zur Erstellung des Bildes verwendet wurde.

page_number

int32

Falls es sich um eine PDF- oder TIFF-Datei handelt, gibt dieses Feld die Seitenzahl in der Datei an, die zum Erstellen des Bildes verwendet wurde.

ImageContext

Bildkontext- bzw. funktionsspezifische Parameter

Felder
lat_long_rect

LatLongRect

Nicht verwendet

language_hints[]

string

Liste der Sprachen, die für TEXT_DETECTION verwendet werden sollen Ein leerer Wert liefert in den meisten Fällen die besten Ergebnisse, weil dadurch die automatische Spracherkennung aktiviert wird. Bei Sprachen, die auf dem lateinischen Alphabet basieren, ist die Einstellung language_hints nicht erforderlich. In seltenen Fällen werden durch das Festlegen eines Hinweises verbesserte Ergebnisse erzielt, wenn die Sprache des Bildtextes bekannt ist. Falls der Hinweis jedoch falsch ist, behindert er die Texterkennung erheblich. Wenn eine oder mehrere der angegebenen Sprachen nicht zu den unterstützten Sprachen zählen, gibt die Texterkennung einen Fehler zurück.

crop_hints_params

CropHintsParams

Parameter für Anmerkungsanfrage zu Zuschneidehinweisen

product_search_params

ProductSearchParams

Parameter für die Produktsuche.

web_detection_params

WebDetectionParams

Parameter für Weberkennung

ImageProperties

Speichert Bildeigenschaften, z. B. dominante Farben

Felder
dominant_colors

DominantColorsAnnotation

Falls vorhanden, wurden dominante Farben erfolgreich abgeschlossen.

ImageSource

Externe Bildquelle (Google Cloud Storage- oder Web-URL-Bildspeicherort)

Felder
gcs_image_uri

string

Verwenden Sie stattdessen image_uri.

Der Google Cloud Storage-URI der Form gs://bucket_name/object_name. Objektversionsverwaltung wird nicht unterstützt. Weitere Informationen finden Sie unter Google Cloud Storage-Anfrage-URIs.

image_uri

string

Der URI des Quell-Images. Es gibt folgende Möglichkeiten:

  1. Der Google Cloud Storage-URI der Form gs://bucket_name/object_name. Objektversionsverwaltung wird nicht unterstützt. Weitere Informationen finden Sie unter Google Cloud Storage-Anfrage-URIs.

  2. Eine öffentlich zugängliche HTTP-/HTTPS-Bild-URL. Beim Abrufen von Bildern von HTTP- oder HTTPS-URLs kann Google nicht garantieren, dass die Anfrage abgeschlossen wird. Ihre Anfrage kann fehlschlagen, wenn der angegebene Host die Anfrage ablehnt (z. B. aufgrund von Anfragendrosselung oder zur DoS-Prävention) oder wenn Google Anfragen an die Website drosselt, um Missbrauch vorzubeugen. Sie sollten sich bei Produktionsanwendungen nicht auf extern gehostete Bilder verlassen.

Wenn sowohl gcs_image_uri als auch image_uri angegeben sind, hat image_uri Vorrang.

ImportProductSetsGcsSource

Der Google Cloud Storage-Speicherort für eine CSV-Datei, die in jeder Zeile eine Liste von ImportProductSetRequests enthält.

Felder
csv_file_uri

string

Der Google Cloud Storage-URI der CSV-Eingabedatei.

Der URI muss mit gs:// beginnen.

Das Format der CSV-Eingabedatei sollte ein Bild pro Zeile sein. In jeder Zeile sind acht Spalten vorhanden.

  1. image-uri
  2. image-id
  3. product-set-id
  4. product-id
  5. product-category
  6. product-display-name
  7. labels
  8. bounding-poly

Die Spalten image-uri, product-set-id, product-id und product-category sind erforderlich. Alle anderen Spalten sind optional.

Wenn die ProductSet- und Product-Werte, die in den Werten product-set-id und product-id angegeben sind, nicht vorhanden sind, erstellt das System eine neue ProductSet oder Product für das Image. In diesem Fall verweist die Spalte product-display-name auf display_name, die Spalte product-category auf product_category und die Spalte labels auf product_labels.

Die Spalte image-id ist optional, muss aber gegebenenfalls angegeben werden. Wenn sie leer ist, weist das System dem Bild automatisch eine eindeutige ID zu.

Die Spalte product-display-name ist optional. Wenn dieser Wert leer ist, setzt das System das Feld display_name für das Produkt auf ein Leerzeichen („ “). Sie können display_name später mithilfe der API aktualisieren.

Wenn eine Product mit dem angegebenen product-id bereits vorhanden ist, ignoriert das System die Spalten product-display-name, product-category und labels.

Die Spalte labels (optional) enthält eine Zeile mit durch Kommas getrennten Schlüssel/Wert-Paaren im folgenden Format:

"key_1=value_1,key_2=value_2,...,key_n=value_n"

In der Spalte bounding-poly (optional) wird ein bestimmter Bereich eines Bilds aus dem Bild auf die gleiche Weise aufgeführt wie CreateReferenceImage. Wenn Sie die Spalte bounding-poly nicht angeben, versucht das System, interessante Regionen automatisch zu erkennen.

Pro Zeile ist maximal eine Spalte bounding-poly zulässig. Wenn das Bild mehrere relevante Regionen enthält, fügen Sie der CSV-Datei eine Zeile mit denselben Produktinformationen und den bounding-poly-Werten für die einzelnen Regionen hinzu.

Die Spalte bounding-poly muss eine gerade Anzahl durch Kommas getrennter Zahlen im Format „p1_x,p1_y,p2_x,p2_y,...,pn_x,pn_y“ enthalten. Verwenden Sie für absolute Begrenzungspolygone nicht negative Ganzzahlen und für normalisierte Begrenzungspolygone Gleitkommawerte in [0, 1].

Die Größe des Bildes wird vom System angepasst, wenn das Bild zu groß für die Verarbeitung ist (größer als 20 MP).

ImportProductSetsInputConfig

Der Eingabeinhalt für die Methode ImportProductSets.

Felder
gcs_source

ImportProductSetsGcsSource

Der Google Cloud Storage-Speicherort für eine CSV-Datei, die in jeder Zeile eine Liste von ImportProductSetRequests enthält.

ImportProductSetsRequest

Anfragenachricht für die Methode ImportProductSets.

Felder
parent

string

Das Projekt, in das die Produktgruppen importiert werden sollen.

Format ist projects/PROJECT_ID/locations/LOC_ID.

input_config

ImportProductSetsInputConfig

Der Eingabeinhalt für die Liste der Anfragen.

ImportProductSetsResponse

Antwortnachricht für die Methode ImportProductSets.

Diese Nachricht wird von der Methode google.longrunning.Operations.GetOperation im zurückgegebenen Feld google.longrunning.Operation.response zurückgegeben.

Felder
reference_images[]

ReferenceImage

Die Liste der erfolgreich importierten reference_images.

statuses[]

Status

Der RPC-Status für jede ImportProductSet-Anfrage, einschließlich Erfolg und Fehler.

Die Anzahl der Status hier stimmt mit der Anzahl der Zeilen in der CSV-Datei überein. Status[i] speichert den Erfolgs- oder Fehlerstatus der i-ten Zeile der CSV-Datei ab Zeile 0.

InputConfig

Der gewünschte Eingabeort und die Metadaten.

Felder
gcs_source

GcsSource

Der Google Cloud Storage-Speicherort, aus dem die Eingabe gelesen werden soll.

content

bytes

Dateiinhalt, dargestellt als ein Bytestream. Hinweis: Wie bei allen bytes-Feldern verwenden auch Protokollpuffer eine reine Binärdarstellung, während JSON-Darstellungen Base64 verwenden.

Derzeit funktioniert dieses Feld nur für BatchAnnotateFiles-Anfragen. Sie funktioniert nicht bei AsyncBatchAnnotateFiles-Anfragen.

mime_type

string

Der Typ der Datei. Im Moment werden nur „application/pdf“, „image/tiff“ und „image/gif“ unterstützt. Platzhalter werden nicht unterstützt.

LatLongRect

Durch LatLng-Paare (Min. und Max.) festgelegtes Rechteck

Felder
min_lat_lng

LatLng

Breiten-/Längengradpaar (Min.)

max_lat_lng

LatLng

Breiten-/Längengradpaar (Max.)

Wahrscheinlichkeit

Eine "bucketisierte" Darstellung von Wahrscheinlichkeiten, die Kunden höchst stabile Ergebnisse bei Modellaktualisierungen liefern soll.

Enums
UNKNOWN Unbekannte Wahrscheinlichkeit
VERY_UNLIKELY Es ist sehr unwahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.
UNLIKELY Es ist unwahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.
POSSIBLE Es ist möglich, dass das Bild zur angegebenen Kategorie gehört.
LIKELY Es ist wahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.
VERY_LIKELY Es ist sehr wahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.

ListProductSetsRequest

Anfragenachricht für die Methode ListProductSets.

Felder
parent

string

Das Projekt, aus dem Produktgruppen aufgelistet werden sollen.

Format ist projects/PROJECT_ID/locations/LOC_ID.

page_size

int32

Die maximale Anzahl der Elemente, die zurückzugeben sind. Standard 10, maximal 100

page_token

string

Der „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

ListProductSetsResponse

Antwortnachricht für die Methode ListProductSets.

Felder
product_sets[]

ProductSet

Liste der ProductSets.

next_page_token

string

Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind.

ListProductsInProductSetRequest

Anfragenachricht für die Methode ListProductsInProductSet.

Felder
name

string

Die ProductSet-Ressource, für die Produkte abgerufen werden sollen.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

page_size

int32

Die maximale Anzahl der Elemente, die zurückzugeben sind. Standard 10, maximal 100

page_token

string

Der „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

ListProductsInProductSetResponse

Antwortnachricht für die Methode ListProductsInProductSet.

Felder
products[]

Product

Die Liste der Produkte.

next_page_token

string

Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind.

ListProductsRequest

Anfragenachricht für die Methode ListProducts.

Felder
parent

string

Das Projekt ODER ProductSet, aus dem Produkte aufgelistet werden sollen.

Format: projects/PROJECT_ID/locations/LOC_ID

page_size

int32

Die maximale Anzahl der Elemente, die zurückzugeben sind. Standard 10, maximal 100

page_token

string

Der „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

ListProductsResponse

Antwortnachricht für die Methode ListProducts.

Felder
products[]

Product

Liste der Produkte.

next_page_token

string

Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind.

ListReferenceImagesRequest

Anfragenachricht für die Methode ListReferenceImages.

Felder
parent

string

Ressourcenname des Produkts, das die Referenzbilder enthält.

Format ist projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

page_size

int32

Die maximale Anzahl der Elemente, die zurückzugeben sind. Standard 10, maximal 100

page_token

string

Ein Token, das eine Ergebnisseite identifiziert, die zurückgegeben werden soll. Dies ist der Wert von nextPageToken, der in einer vorherigen Anfrage der Referenzbildliste zurückgegeben wurde.

Wenn keine Angabe gemacht wird, wird standardmäßig die erste Seite verwendet.

ListReferenceImagesResponse

Antwortnachricht für die Methode ListReferenceImages.

Felder
reference_images[]

ReferenceImage

Die Liste der Referenzbilder.

page_size

int32

Die maximale Anzahl der Elemente, die zurückzugeben sind. Standard 10, maximal 100

next_page_token

string

Der „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

LocalizedObjectAnnotation

Satz erkannter Objekte mit Begrenzungsrahmen.

Felder
mid

string

Objekt-ID, die mit EntityAnnotation Mitte ausgerichtet werden soll.

language_code

string

Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“. Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

name

string

Objektname, ausgedrückt in der Sprache language_code.

score

float

Punktzahl des Ergebnisses. Bereich [0, 1].

bounding_poly

BoundingPoly

Bildbereich, zu dem diese Entität gehört. Dies muss ausgefüllt werden.

LocationInfo

Erkannte Entitätsstandortinformationen

Felder
lat_lng

LatLng

Breiten-/Längengradkoordinaten des Standorts

NormalizedVertex

Ein Scheitelpunkt repräsentiert einen 2D-Punkt im Bild. HINWEIS: Die normalisierten Eckpunktkoordinaten sind relativ zum Originalbild und reichen von 0 bis 1.

Felder
x

float

X-Koordinate

y

float

Y-Koordinate

OperationMetadata

Enthält Metadaten für die BatchAnnotateImages-Vorgänge.

Felder
state
(deprecated)

State

Aktueller Status des Batchvorgangs.

create_time

Timestamp

Die Uhrzeit, zu der die Batchanfrage empfangen wurde.

update_time

Timestamp

Die Uhrzeit, zu der das Ergebnis des Vorgangs zuletzt aktualisiert wurde.

Zustandsorientiert

Status für Batchvorgänge.

Enums
STATE_UNSPECIFIED Ungültig
CREATED Anfrage ist eingegangen
RUNNING Die Anfrage wird aktiv verarbeitet.
DONE Die Batchverarbeitung ist abgeschlossen
CANCELLED Die Batchverarbeitung wurde abgebrochen

OutputConfig

Der gewünschte Ausgabeort und die gewünschten Metadaten.

Felder
gcs_destination

GcsDestination

Der Google Cloud Storage-Speicherort, an den die Ausgaben geschrieben werden.

batch_size

int32

Die maximale Anzahl von Antwort-Protos, die in jede JSON-Ausgabedatei in Google Cloud Storage eingefügt werden. Der gültige Bereich ist [1, 100]. Wenn keine Angabe erfolgt, beträgt der Standardwert 20.

Bei einer PDF-Datei mit 100 Seiten werden beispielsweise 100 Antwort-Proto-Dateien generiert. Bei batch_size = 20 werden 5 JSON-Dateien mit 20 Antwort-Proto-Dateien unter dem Präfix gcs_destination geschrieben.uri

Derzeit gilt batch_size nur für GcsDestination und bietet möglicherweise Unterstützung für andere Ausgabekonfigurationen.

Seite

Mit OCR erkannte Seite

Felder
property

TextProperty

Weitere auf der Seite erkannte Informationen

width

int32

Seitenbreite. Bei PDF-Dateien handelt es sich um Punkte. Bei Bildern (einschließlich TIFFs) ist die Einheit Pixel.

height

int32

Seitenhöhe. Bei PDF-Dateien handelt es sich um Punkte. Bei Bildern (einschließlich TIFFs) ist die Einheit Pixel.

blocks[]

Block

Liste von Textblöcken, Bildern usw. auf dieser Seite

confidence

float

Die Konfidenz der OCR-Ergebnisse auf der Seite. Bereich [0, 1].

Absatz

Strukturelle Texteinheit, die mehrere Wörter in einer bestimmten Reihenfolge darstellt

Felder
property

TextProperty

Zusätzliche für den Absatz erkannte Informationen

bounding_box

BoundingPoly

Der Begrenzungsrahmen für den Absatz. Die Eckpunkte werden in der Reihenfolge von oben links, rechts oben, rechts unten und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition des Lesens des Texts in „natürlicher“ Ausrichtung. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 | | 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 | | 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).

words[]

Word

Liste der Wörter in diesem Absatz

confidence

float

Die Konfidenz der OCR-Ergebnisse für den Absatz. Bereich [0, 1].

Position

Eine 3D-Position im Bild, die hauptsächlich für Gesichtserkennungs-Landmarks verwendet wird. Eine gültige Position muss sowohl x- als auch y-Koordinaten haben. Die Positionskoordinaten haben den gleichen Maßstab wie das Originalbild.

Felder
x

float

X-Koordinate

y

float

Y-Koordinate

z

float

Z-Koordinate (oder Tiefe)

Produkt

Ein Produkt enthält ReferenceImages.

Felder
name

string

Der Ressourcenname des Produkts.

Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

Dieses Feld wird beim Erstellen eines Produkts ignoriert.

display_name

string

Der vom Nutzer bereitgestellte Name für dieses Produkt. Darf nicht leer sein Darf höchstens 4.096 Zeichen enthalten.

description

string

Vom Nutzer bereitgestellte Metadaten, die mit diesem Produkt gespeichert werden sollen. Darf höchstens 4.096 Zeichen enthalten.

product_category

string

Die Kategorie des zum Referenzbild gehörenden Produkts. Geben Sie „homegoods-v2“, „apparel-v2“, „toys-v2“ oder „packagedgoods-v1“ ein. Die älteren Kategorien „homegoods“, „apparel“ und „toys“ werden weiterhin unterstützt, aber eingestellt. Verwenden Sie für neue Produkte bitte „homegoods-v2“, „apparel-v2“ oder „toys-v2“, um die Genauigkeit der Produktsuche zu verbessern. Es wird auch empfohlen, vorhandene Produkte in diese Kategorien zu migrieren.

Dieses Feld ist unveränderlich.

product_labels[]

KeyValue

Schlüssel/Wert-Paare, die an ein Produkt angehängt werden können. Zum Zeitpunkt der Abfrage können Einschränkungen basierend auf den product_labels festgelegt werden.

Ganzzahlwerte können als Strings bereitgestellt werden, z. B. „1199“. Nur Strings mit ganzzahligen Werten können einer bereichsbasierten Einschränkung entsprechen. Diese Funktion wird bald unterstützt.

Einem Schlüssel können mehrere Werte zugewiesen werden. Ein Produkt kann bis zu 100 product_labels haben.

KeyValue

Ein Produktlabel, das als Schlüssel/Wert-Paar dargestellt wird.

Felder
key

string

Der Schlüssel des Labels, das an das Produkt angehängt ist. Darf nicht leer sein und 128 Byte nicht überschreiten.

value

string

Der Wert des Labels, der an das Produkt angehängt wird. Darf nicht leer sein und 128 Byte nicht überschreiten.

ProductSearchParams

Parameter für eine Suchanfrage für die Produktsuche.

Felder
bounding_poly

BoundingPoly

Das Begrenzungspolygon um den gewünschten Bereich im Bild. Optional. Ist er nicht angegeben, so wird der Ermessen des Systems angewendet.

product_set

string

Der Ressourcenname einer ProductSet, die nach ähnlichen Bildern gesucht werden soll.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID.

product_categories[]

string

Die Liste der Produktkategorien, in denen gesucht werden soll. Momentan berücksichtigen wir nur die erste Kategorie. Wir müssen entweder „homegoods-v2“, „apparel-v2“ oder „toys-v2“ angeben. Die älteren Kategorien „homegoods“, „apparel“ und „toys“ werden weiterhin unterstützt, aber eingestellt. Verwenden Sie für neue Produkte bitte „homegoods-v2“, „apparel-v2“ oder „toys-v2“, um die Genauigkeit der Produktsuche zu verbessern. Es wird auch empfohlen, vorhandene Produkte in diese Kategorien zu migrieren.

filter

string

Der Filterausdruck. Damit können Suchergebnisse basierend auf Produktlabels beschränkt werden. Derzeit wird eine AND-Verknüpfung von OR-Operator-Ausdrücken unterstützt, in denen jeder Ausdruck in einem OR denselben Schlüssel haben muss. Zur Verbindung von Schlüssel und Wert muss ein „=“ verwendet werden.

Zum Beispiel ist „(color = red OR color = blue) UND Marke = Google“ akzeptabel, aber „(color = red ODER Marke = Google)“ ist nicht zulässig. „color: red“ ist nicht zulässig, da es „:“ anstelle von „=“ verwendet.

ProductSearchResults

Ergebnisse für eine Produktsuche

Felder
index_time

Timestamp

Zeitstempel des Index, der diese Ergebnisse bereitgestellt hat. Produkte, die der Produktgruppe hinzugefügt und nach dieser Zeit aus der Produktgruppe entfernt wurden, sind nicht in den aktuellen Ergebnissen enthalten.

results[]

Result

Ergebnisliste, eine für jede Produktübereinstimmung.

product_grouped_results[]

GroupedResult

Liste der Ergebnisse, die nach im Abfragebild erkannten Produkten gruppiert sind. Jeder Eintrag entspricht einem Begrenzungspolygon im Abfragebild und enthält die passenden Produkte für diese Region. Es kann zu Übereinstimmungen bei den Produkten kommen, die alle Produktergebnisse enthalten.

Gruppiertes Ergebnis

Informationen zu Produkten, die einem einzelnen Produkt in einem Abfragebild ähneln.

Felder
bounding_poly

BoundingPoly

Das Begrenzungspolygon um das im Abfragebild erkannte Produkt.

results[]

Result

Ergebnisliste, eine für jede Produktübereinstimmung.

Ergebnis

Informationen zu einem Produkt.

Felder
product

Product

Das Produkt

score

float

Eine Konfidenzstufe der Übereinstimmung, zwischen 0 (keine Konfidenz) und 1 (hohe Konfidenz).

image

string

Der Ressourcenname des Bildes des Produkts, das der Abfrage am nächsten kommt.

ProductSet

Eine Produktgruppe enthält Produkte. Ein Produktset kann maximal 1 Million Referenzbilder enthalten. Wird diese Beschränkung überschritten, schlägt die regelmäßige Indexierung fehl.

Felder
name

string

Der Ressourcenname des ProductSet.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID.

Dieses Feld wird beim Erstellen eines ProductSet ignoriert.

display_name

string

Der vom Nutzer bereitgestellte Name für dieses ProductSet. Darf nicht leer sein Darf höchstens 4.096 Zeichen enthalten.

index_time

Timestamp

Nur Ausgabe Der Zeitpunkt, zu dem diese Produktgruppe zuletzt indexiert wurde. Die Abfrageergebnisse spiegeln alle Aktualisierungen vor diesem Zeitpunkt wider. Wenn dieses ProductSet nie indexiert wurde, ist dieser Zeitstempel der Standardwert „1970-01-01T00:00:00Z“.

Dieses Feld wird beim Erstellen eines ProductSet ignoriert.

index_error

Status

Nur Ausgabe Bei der Indexierung der Produktgruppe ist ein Fehler aufgetreten.

Dieses Feld wird beim Erstellen eines ProductSet ignoriert.

Attribut

Eine Property besteht aus einem vom Nutzer bereitgestellten Name-Wert-Paar.

Felder
name

string

Name der Eigenschaft

value

string

Wert der Eigenschaft

uint64_value

uint64

Wert von numerischen Eigenschaften

ReferenceImage

Ein ReferenceImage stellt ein Produktbild und die zugehörigen Metadaten wie Begrenzungsrahmen dar.

Felder
name

string

Der Ressourcenname des Referenzbildes.

Format ist:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID.

Dieses Feld wird beim Erstellen eines Referenzbildes ignoriert.

uri

string

Der Google Cloud Storage-URI des Referenzbildes.

Der URI muss mit gs:// beginnen.

Erforderlich.

bounding_polys[]

BoundingPoly

Polygone an den relevanten Bereichen im Referenzbild begrenzen Optional. Wenn dieses Feld leer ist, versucht das System, interessante Regionen zu erkennen. Es werden maximal zehn Begrenzungspolygone verwendet.

Die bereitgestellte Form wird in ein nicht gedrehtes Rechteck konvertiert. Nach der Umwandlung muss der kleine Rand des Rechtecks größer oder gleich 300 Pixel sein. Das Seitenverhältnis muss 1:4 oder niedriger sein, z. B. 1:3 ist zulässig, 1:5 nicht.

RemoveProductFromProductSetRequest

Anfragenachricht für die Methode RemoveProductFromProductSet.

Felder
name

string

Der Ressourcenname des zu ändernden ProductSets.

Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

product

string

Der Ressourcenname des Produkts, das aus dieser Produktgruppe entfernt werden soll.

Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

SafeSearchAnnotation

Eine Reihe von Merkmalen des Bildes, die durch Methoden für maschinelles Sehen in Bezug auf SafeSearch-Kategorien berechnet wurden (z. B. nicht jugendfreie Inhalte, Spoofing, Medizin, Gewalt).

Felder
adult

Likelihood

Stellt die Wahrscheinlichkeit für nur für Erwachsene bestimmte Inhalte für das Bild dar. Inhalte nur für Erwachsene können Elemente wie Nacktheit, pornografische Bilder oder Cartoons oder sexuelle Aktivitäten enthalten.

spoof

Likelihood

Wahrscheinlichkeit für Spoofing. Die Wahrscheinlichkeit, dass eine Änderung an der kanonischen Version des Bildes vorgenommen wurde, um es lustig oder anstößig erscheinen zu lassen.

medical

Likelihood

Wahrscheinlichkeit, dass dies ein medizinisches Bild ist.

violence

Likelihood

Wahrscheinlichkeit, dass dieses Bild gewalttätige Inhalte enthält.

racy

Likelihood

Wahrscheinlichkeit, dass das Anfragebild nicht jugendfreie Inhalte enthält. Nicht jugendfreie Inhalte können unter anderem knappe oder durchsichtige Bekleidung, strategisch verhüllte Nacktheit, anzügliche oder provozierende Posen oder Nahaufnahmen sensibler Körperpartien umfassen.

Symbol

Eine einzelne Symboldarstellung

Felder
property

TextProperty

Zusätzliche für das Symbol erkannte Informationen

bounding_box

BoundingPoly

Der Begrenzungsrahmen für das Symbol. Die Eckpunkte werden in der Reihenfolge von oben links, rechts oben, rechts unten und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition des Lesens des Texts in „natürlicher“ Ausrichtung. Beispiel: * Wenn der Text horizontal ist, kann dies wie folgt aussehen: 0----1 | | 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 | | 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).

text

string

Die tatsächliche UTF-8-Darstellung des Symbols

confidence

float

Die Konfidenz der OCR-Ergebnisse für das Symbol. Bereich [0, 1].

TextAnnotation

TextAnnotation enthält eine strukturierte Darstellung von mit OCR extrahiertem Text. Die Hierarchie einer mit OCR extrahierten Textstruktur sieht folgendermaßen aus: TextAnnotation -> Seite -> Block -> Absatz -> Wort -> Symbol. Jede Strukturkomponente ab Seite kann außerdem eigene Eigenschaften haben. Eigenschaften beschreiben erkannte Sprachen, Unterbrechungen usw. Weitere Informationen finden Sie in der TextAnnotation.TextProperty-Nachrichtendefinition unten.

Felder
pages[]

Page

Liste der durch OCR erkannten Seiten

text

string

Auf den Seiten erkannter UTF-8-Text

DetectedBreak

Erkannter Anfang oder erkanntes Ende einer Strukturkomponente

Felder
type

BreakType

Erkannte Art der Unterbrechung

is_prefix

bool

Wahr, wenn die Unterbrechung vor dem Element steht

BreakType

Aufzählung zur Angabe der Art der erkannten Unterbrechung. Neue Zeile, Leerzeichen usw.

Enums
UNKNOWN Unbekannte Art von Unterbrechungslabel
SPACE Normales Leerzeichen
SURE_SPACE Sichere Lücke (sehr breit)
EOL_SURE_SPACE Zeilenumbruch
HYPHEN Bindestrich am Ende der Zeile, der im Text nicht vorhanden ist; tritt nicht gleichzeitig mit SPACE, LEADER_SPACE oder LINE_BREAK auf.
LINE_BREAK Zeilenumbruch, der einen Absatz beendet

DetectedLanguage

Erkannte Sprache für eine Strukturkomponente

Felder
language_code

string

Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“. Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

confidence

float

Die Konfidenz der erkannten Sprache. Bereich [0, 1].

TextProperty

Zusätzliche Informationen, die bei der Strukturkomponente erkannt wurden

Felder
detected_languages[]

DetectedLanguage

Eine Liste der erkannten Sprachen zusammen mit der Konfidenz

detected_break

DetectedBreak

Erkannter Anfang oder erkanntes Ende eines Textsegments

UpdateProductRequest

Anfragenachricht für die Methode UpdateProduct.

Felder
product

Product

Die Produktressource, die die Ressource auf dem Server ersetzt. product.name ist unveränderlich.

update_mask

FieldMask

Der FieldMask, der angibt, welche Felder aktualisiert werden sollen. Wenn „update_mask“ nicht angegeben ist, müssen alle änderbaren Felder aktualisiert werden. Gültige Maskenpfade sind product_labels, display_name und description.

UpdateProductSetRequest

Anfragenachricht für die Methode UpdateProductSet.

Felder
product_set

ProductSet

Die ProductSet-Ressource, die die Ressource auf dem Server ersetzt.

update_mask

FieldMask

Der FieldMask, der angibt, welche Felder aktualisiert werden sollen. Wenn „update_mask“ nicht angegeben ist, müssen alle änderbaren Felder aktualisiert werden. Der gültige Maskenpfad ist display_name.

Vertex

Ein Scheitelpunkt repräsentiert einen 2D-Punkt im Bild. HINWEIS: Die Scheitelpunktkoordinaten haben den gleichen Maßstab wie das Originalbild.

Felder
x

int32

X-Koordinate

y

int32

Y-Koordinate

WebDetection

Relevante Informationen für das Bild aus dem Internet

Felder
web_entities[]

WebEntity

Abgeleitete Entitäten aus ähnlichen Bildern im Internet

full_matching_images[]

WebImage

Komplett übereinstimmende Bilder aus dem Internet. Können skalierte Kopien des Abfragebildes beinhalten.

partial_matching_images[]

WebImage

Teilweise übereinstimmende Bilder aus dem Internet. Die Bilder sind so ähnlich, dass sie einige Hauptmerkmale teilen. Zum Beispiel wird ein Originalbild wahrscheinlich eine partielle Übereinstimmung mit seinen Zuschnitten haben.

pages_with_matching_images[]

WebPage

Webseiten, die die den übereinstimmenden Bilder aus dem Internet enthalten

visually_similar_images[]

WebImage

Die visuell ähnlichen Bildergebnisse

best_guess_labels[]

WebLabel

Die Vermutung, dass der Dienst das Thema des Anfragebilds schätzt. Abgeleitet aus ähnlichen Bildern im offenen Web

WebEntity

Aus ähnlichen Bildern im Internet abgeleitete Entität

Felder
entity_id

string

Intransparente Entitäts-ID

score

float

Gesamtrelevanzbewertung für die Entität. Nicht normalisiert und nicht für verschiedene Bildabfragen vergleichbar.

description

string

Kanonische Beschreibung der Entität auf Englisch

WebImage

Metadaten für Onlinebilder

Felder
url

string

Die Ergebnisbild-URL

score

float

(Verworfen) Gesamtrelevanzbewertung für das Bild

WebLabel

Label, um zusätzliche Metadaten für die Weberkennung bereitzustellen

Felder
label

string

Label für zusätzliche Metadaten

language_code

string

Der BCP-47-Sprachcode für label, beispielsweise „en-US“ oder „sr-Latn“. Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

WebPage

Metadaten für Webseiten

Felder
url

string

Die URL der Ergebniswebseite

score

float

(Verworfen) Gesamtrelevanzbewertung für die Webseite

page_title

string

Titel der Webseite, kann HTML-Markups enthalten

full_matching_images[]

WebImage

Komplett übereinstimmende Bilder auf der Seite. Können skalierte Kopien des Abfragebildes beinhalten.

partial_matching_images[]

WebImage

Teilweise übereinstimmende Bilder auf der Seite. Die Bilder sind so ähnlich, dass sie einige Hauptmerkmale teilen. Zum Beispiel wird ein Originalbild wahrscheinlich eine partielle Übereinstimmung mit seinen Zuschnitten haben.

WebDetectionParams

Parameter für die Weberkennungsanfrage

Felder
include_geo_results

bool

Gibt an, ob Ergebnisse enthalten sein sollen, die aus den Geoinformationen im Bild abgeleitet wurden

Wort

Darstellung eines Worts

Felder
property

TextProperty

Zusätzliche für das Wort erkannte Informationen

bounding_box

BoundingPoly

Der Begrenzungsrahmen für das Wort. Die Eckpunkte werden in der Reihenfolge von oben links, rechts oben, rechts unten und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition des Lesens des Texts in „natürlicher“ Ausrichtung. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 | | 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 | | 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).

symbols[]

Symbol

Liste der Symbole im Wort. Die Reihenfolge der Symbole folgt der natürlichen Lesereihenfolge.

confidence

float

Die Konfidenz der OCR-Ergebnisse für das Wort. Bereich [0, 1].