Unterstützte Bilder

Dateiformate

Die Vision API unterstützt die folgenden Bildtypen:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • Animiertes GIF (nur erster Rahmen)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

Beachten Sie, dass manche dieser Bildformate, wie etwa JPEG, "verlustbehaftet" sind. Wenn Sie die Dateigröße dieser verlustbehafteten Formate reduzieren, verschlechtert sich möglicherweise die Bildqualität und damit die Genauigkeit der Vision API.

Bildgröße

Bilder sollten generell mindestens 640 x 480 Pixel (ca. 300.000 Pixel) groß sein, um eine genaue Bilderkennung in der Cloud Vision API zu ermöglichen. Alle Details zu den verschiedenen Arten von Vision API-Elementanfragen werden im Folgenden gezeigt:

Vision API-Funktion Empfohlene Größe * Hinweise
FACE_DETECTION 1.600 x 1.200 Am wichtigsten ist der Abstand zwischen den Augen.
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION und DOCUMENT_TEXT_DETECTION 1.024 x 768 Für die Zeichenerkennung mit OCR ist eine höhere Auflösung erforderlich.
SAFE_SEARCH_DETECTION 640 x 480

Die empfohlenen Größen variieren je nach erkanntem Element. Beispielsweise erfordern Anfragen für FACE_DETECTION generell größere Bilder, da die zu erkennenden Elemente (Gesichter) kleiner als das Bild selbst sind. Bei Anfragen nach LABEL_DETECTION wird hingegen das gesamte Bild bewertet.

In der Praxis funktioniert eine Standardgröße von 640 x 480 Pixeln in den meisten Fällen gut. Bei größeren Bildern erhöht sich die Genauigkeit mitunter nicht, während der Durchsatz stark abnimmt. Verarbeiten Sie die Bilder nach Möglichkeit vorab, um sie auf die Mindeststandards zu verkleinern.

Dateigröße

An die Vision API gesendete Bilddateien dürfen 20 MB nicht überschreiten. Wenn Sie die Dateigröße verringern, kann sich der Durchsatz deutlich erhöhen. Achten Sie jedoch darauf, dass sich dabei nicht die Bildqualität verschlechtert. Hinweis: Die Vision API legt für JSON-Anfragen einen Grenzwert von 10 MB fest. Größere Dateien sollten in Cloud Storage oder im Web gehostet werden, anstatt sie als Inhalte mit Base64-Codierung in JSON zu übergeben.