OCR-Sprachunterstützung

Die Texterkennungsfunktion der Cloud Vision API erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.

Die Angabe eines Sprachhinweises für den Dienst ist nicht erforderlich, aber möglich, falls der Dienst die Sprache in Ihrem Bild nicht erkennt.

Seit der Veröffentlichung von Handschrift-Texterkennung (OCR) müssen Bilder, die Handschrift enthalten, bei der Verwendung von DOCUMENT_TEXT_DETECTION nicht mehr mit einem Flag languageHints für Handschrift versehen werden.

Optionale Sprachhinweise werden bei TEXT_DETECTION- und DOCUMENT_TEXT_DETECTION-Anfragen im ImageContext der Anfrage als Liste von languageHints angegeben.

Jeder Sprachcodeparameter besteht üblicherweise aus einer BCP-47-Kennung. Diese Parameter können in der Form Sprache-Region festgelegt werden. Dabei bezieht sich Sprache auf die Standardsprache und die optionale Angabe für Region auf eine Region (in der Regel eine Länderkennung) mit einem bestimmten Dialekt. Beispiel: Chinesisch kann als Vereinfachtes Chinesisch (zh-Hans) dargestellt werden, wie es in der Volksrepublik China geschrieben wird, oder als Traditionelles Chinesisch in der taiwanischen Schreibweise (zh-Hant).

Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:

  1. Unterstützte Sprachen sind diejenigen, denen wir Priorität einräumen und bezüglich derer wir regelmäßig Leistungsbewertungen vornehmen.
  2. Experimentelle Sprachen sind Sprachen, die aktiv entwickelt, aber nicht regelmäßig ausgewertet werden.
  3. Zugeordnete Sprachen werden unterstützt, indem sie einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet werden. "en-GB" wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als "en". Wir bemühen uns, den korrekten Code der zugeordneten Sprache im Feld "Sprache der Entität" zurückzugeben, aber zugeordnete Sprachen werden mit höherer Wahrscheinlichkeit falsch identifiziert als voll unterstützte oder experimentell unterstützte Sprachen.

Die Liste der Sprachen, die von TEXT_DETECTION und DOCUMENT_TEXT_DETECTION unterstützt werden (mit den zugehörigen languageHint-Codes), wird unten angezeigt.

Wenn der Sprachhinweis leer gelassen wird, versuchen wir, die am besten passende Sprache automatisch zu erkennen. Der Endpunkt TEXT_DETECTION erkennt nur einen Teil der unterstützten Sprachen automatisch, während der Endpunkt DOCUMENT_TEXT_DETECTION alle unterstützten Sprachen automatisch erkennt.

Unterstützte Sprachen

Die folgenden Sprachen werden priorisiert und regelmäßig ausgewertet.

Um nach bestimmten Funktionen zu filtern, geben Sie die gewünschte Sprache ein oder wählen Sie sie direkt aus dem Drop-down-Menü aus:

Experimentelle Sprachen

Die folgenden Sprachen befinden sich in der Entwicklungsphase und werden noch nicht regelmäßig evaluiert.

Zugeordnete Sprachen

Die folgenden Sprachen sind einem anderen Sprachcode zugeordnet oder einem allgemeinen Zeichenerkenner.