OCR-Sprachunterstützung

Die Texterkennungsfunktion der Cloud Vision API erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.

Die Angabe eines Sprachhinweises für den Dienst ist nicht erforderlich, aber möglich, falls der Dienst die Sprache in Ihrem Bild nicht erkennt.

Seit der Veröffentlichung des GA-Release Handschrift-Texterkennung (Optical Character Recognition, OCR) müssen Bilder, die Handschrift enthalten, bei der Verwendung von DOCUMENT_TEXT_DETECTION nicht mehr mit einem Flag languageHints für Handschrift versehen werden.

Optionale Sprachhinweise werden bei TEXT_DETECTION- und DOCUMENT_TEXT_DETECTION-Anfragen im ImageContext der Anfrage als Liste von languageHints angegeben.

Jeder Sprachcodeparameter besteht üblicherweise aus einer BCP-47-Kennung. Diese Parameter können in der Form Sprache-Region festgelegt werden. Dabei bezieht sich Sprache auf die Standardsprache und die optionale Angabe für Region auf eine Region (in der Regel eine Länderkennung) mit einem bestimmten Dialekt. Beispiel: Chinesisch kann als Vereinfachtes Chinesisch (zh-Hans) dargestellt werden, wie es in der Volksrepublik China geschrieben wird, oder als Traditionelles Chinesisch in der taiwanischen Schreibweise (zh-Hant).

Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:

  1. Unterstützte Sprachen sind diejenigen, denen wir Priorität einräumen und bezüglich derer wir regelmäßig Leistungsbewertungen vornehmen.
  2. Experimentelle Sprachen sind Sprachen, die aktiv entwickelt, aber nicht regelmäßig ausgewertet werden.
  3. Zugeordnete Sprachen werden einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet, um sie zu unterstützen. "en-GB" wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als "en". Wir bemühen uns zwar, den korrekten Code der zugeordneten Sprache im Feld für die Sprache der Entität zurückzugeben, doch kann es bei zugeordneten Sprachen eher als bei vollständig oder experimentell unterstützten Sprachen vorkommen, dass sie als eine ähnliche Sprache und somit falsch identifiziert werden.

Weiter unter finden Sie eine Liste der Sprachen (mit den zugehörigen languageHint-Codes), die von TEXT_DETECTION und DOCUMENT_TEXT_DETECTION unterstützt werden.

Wenn der Sprachhinweis leer gelassen wird, versuchen wir, die am besten passende Sprache automatisch zu erkennen. Der Endpunkt TEXT_DETECTION erkennt nur einen Teil der unterstützten Sprachen automatisch, während der Endpunkt DOCUMENT_TEXT_DETECTION alle unterstützten Sprachen automatisch erkennt.

Unterstützte Sprachen

Die folgenden Sprachen werden priorisiert und regelmäßig ausgewertet.

Wenn Sie nach bestimmten Features filtern möchten, geben Sie die gewünschte Sprache ein oder wählen Sie sie direkt aus dem Drop-down-Menü aus:

Sprache Sprache (deutscher Name) languageHints-Code Skript / Notizen
Afrikaans Afrikaans af Latne
SHQIP Albanisch sq Latne
العربية Arabisch ar Arabisch Moderner Standard
Հայ Armenisch hy Arm
беларускі Belorusisch be Zylinder
বাংলা Bengalisch bn Beng
български Bulgarisch bg Zylinder
Katalanisch Katalanisch ca Latne
普通话 Chinesisch zh Hans/Hant
Hrvatski Kroatisch hr Latne
Čeština Tschechisch cs Latne
Dansk Dänisch da Latne
Kinderländer Niederländisch nl Latne
Englisch Englisch en Latn Amerikanisch
Esili Keel Estnisch et Latne
Philippinisch Philippinisch fil (oder tl) Latne
Suomi Finnisch fi Latne
Français Französisch fr Latn Europa
Deutsch Deutsch de Latne
Ελληνικά Griechisch el Grek
ગુજરાતી Gujarati gu Gujr
עברית Hebräisch iw Hebräisch
हिन्दी Hindi hi Deva
Magya Ungarisch hu Latne
Íslenska Isländisch ist Latne
Indonesisch Indonesisch id Latne
Italiano Italienisch it Latne
日本語 Japanisch ja Japanisch
ಕನ್ನಡ Kannada kn Konda
ភាសាខ្មែរ Khmer km Khm
한국어 Koreanisch ko Kore
ລາວ Lao lo Laotisch
Lattešu Lettisch lv Latne
Lietuvių Litauisch lt Latne
Македонски Mazedonisch mk Zylinder
Bahasa-Mayayu Malaiisch ms Latne
മലയാളം Malayalam ml Gym
मराठी Marathi mr Deva
नेपाली Nepali ne Deva
Norsk Norwegisch no Latn Bokmål
فارسی Persisch fa Arabisch
Polski Polnisch pl Latne
Português Portugiesisch pt Latn Brasilianisch
ਪੰਜਾਬੀ Panjabi pa Guru Gurmukhi
Română Rumänisch ro Latne
Русский Russisch ru Zylinder
Русский (старая орфография) Russisch ru-PETR1708 Zylinder Alte Orthografie
Српски Serbisch sr Zylinn und Latne
Српски (латиница) Serbisch sr-Latn Latne
Slovenčina Slowakei sk Latne
Slovenščina Slowenisch sl Latne
Español Spanisch es Latn Europa
Svenska Schwedisch sv Latne
தமிழ் Tamil ta Tamllisch
తెలుగు Telugu te Tel.
ไทย Thailändisch th Thailändisch
Türkçe Türkisch tr Latne
Українська Ukrainisch uk Zylinder
Tiếng Việt Vietnamesisch vi Latne
Jiddisch Jiddisch yi Hebräisch

Experimentelle Sprachen

Die folgenden Sprachen befinden sich in der Entwicklungsphase und werden noch nicht regelmäßig evaluiert.

Sprache Sprache (deutscher Name) Code für languageHints Skript / Notizen
አማርኛ Amharisch a.m. Ethi
Αρχαία ελληνικά Altgriechisch GPS Grek
অসমীয়া Assamesisch as Beng
Azərbaycan Aserbaidschanisch az Latne
Azərbaycan (qədim yazı) Aserbaidschanisch Az-Cyll Zylinder Alte Orthografie
Euskara Baskisch EU Latne
Bosan produzierte Filme Bosnisch bs Latne
မြန်မာ Burmesisch my Mymmar
Cebuano Cebuano Ceb Latne
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee CHZ Cher
Dhivehi, Dhivehi-bas Dhivehi dV Thaa
རྫོང་ཁ Dschonanka dz Tilt
Esperanto Esperanto eo Latne
Galago Galicisch gl Latne
ქართული Georgisch ka Gerüst
Kreyòl Ayienyen Kreolisch (Haiti) ht Latne
Geilig Irisch ga Latne
Jawa Javanisch jv Latne
Қазақ Kasachisch kk Zylinder
Kirgisisch Kirgisisch ky Zylinder
Lateinamerikanisch Latein la Latne
Mali Maltesisch mt Latne
Монгол Mongolisch mn Zylinder
ଓଡ଼ିଆ Oriya oder Osya
پښتو Paschtunisch ps Arabisch
संस्कृतम् Sanskrit sa Deva
සිංහල Singhalesisch si Sinh
Swahili Swahili sw Latne
ššāleā Suryāyā Syrisch Son Syrisch
བོད་སྐད་ Tibetisch Bo Tilt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arabisch
ʻzbekcha Usbekisch uz Latn Lateinamerikanisch
ʻzbekcha Usbekisch uz-Cyll Zylinder Alte Orthografie
Wirbelsturm Walisisch cy Latne
IsiZulu Zulu zu Latne

Zugeordnete Sprachen

Die folgenden Sprachen sind einem anderen Sprachcode zugeordnet oder einem allgemeinen Zeichenerkenner.

Sprache Sprache (deutscher Name) languageHints-Code Skript / Notizen Zugeordnet zu
بهسا اچيه Achinesisch akkus Latne Latin-Skript-Modell
Lisas Acholi Ach Latne Latin-Skript-Modell
Dangme Adangme Ada Latne Latin-Skript-Modell
Akan Akan ak Latne Latin-Skript-Modell
Anicinâbemowin Algonquin alg Latne Latin-Skript-Modell
Mapudungu Araukanisch Arn Latne Latin-Skript-Modell
Asturien Asturisch Ast Latne Latin-Skript-Modell
Rücken Athabaskan ath Latne Latin-Skript-Modell
Aymar Aru Aymara Ay Latne Latin-Skript-Modell
Bh Ba Bali Balinesisch sperren Latne Latin-Skript-Modell
Bamanankan produzierte Filme Bambara Mbit/s Latne Latin-Skript-Modell
Schmal Bantu Bantu Bnte Latne Latin-Skript-Modell
башҡорт теле Baschkirisch Ba Zylinder Kyrillisches Skriptmodell
Toba–Batak Batak BTS Latne Latin-Skript-Modell
Chibemba Bemba CM Latne Latin-Skript-Modell
Boulder Bikol Bike Latne Latin-Skript-Modell
Buchemarar Bislama bi Latne Latin-Skript-Modell
Brezoneg produzierte Filme Bretonisch br Latne Latin-Skript-Modell
нохчийн / noxçyyn mott Tschetschenisch Ce Zylinder Kyrillisches Skriptmodell
汉语 Chinesisch ZH-Hans Hans Vereinfacht; Mandarin zh
漢語 Chinesisch ZH-Hant Hantel Traditionell; Mandarin zh
普通話 Chinesisch zh-Hant-HK Hantel Mandarin Hongkong zh
Chahta Choctaw Cho Latne Latin-Skript-Modell
Чӑвашла Tschuwaschisch Cv. Zylinder Kyrillisches Skriptmodell
Cree–Montagais–Nasapi Cree CR Latne Latin-Skript-Modell
Mvskoke Bach Musmuse Latne Latin-Skript-Modell
Quırımtatar tili, къырымтатар тили Krimtatarisch Crh Latne Kyrillisches Skriptmodell
Dakhótiyapi, Dakȟótiyapi Dakota Dak Latne Latin-Skript-Modell
Douala Duala Dua Latne Latin-Skript-Modell
Ikɔ Efik Efik Efi Latne Latin-Skript-Modell
Englisch (British) Englisch en-GB Latn Britisch en
Èʋegge Ewe Ab Latne Latin-Skript-Modell
føroysk Mál Färöisch Fo Latne Latin-Skript-Modell
Na Vosa Vakaviti Fidschi JF Latne Latin-Skript-Modell
fɔ̀ngbè Fon Fon Latne Latin-Skript-Modell
Français canadien Französisch fr-CA Latn Kanada fr
Fulani, Fulah, Peul Fulfulde ff Latne Latin-Skript-Modell
Ga Gaa Latne Latin-Skript-Modell
Luganda Ganda LGBT Latne Latin-Skript-Modell
Basa Gayo Gayo Gay / schwul / lesbisch / homosexuell Latne Latin-Skript-Modell
Kiribati Gilbertesisch Gil Latne Latin-Skript-Modell
Gotisch Gotisch hat Latne Latin-Skript-Modell
Guaraní- Guarani Bild Latne Latin-Skript-Modell
Harshen/Halshe Hausa هَرْشَن هَوْسَ Hausa ha Latne Latin-Skript-Modell
ʻŌlelo Hawaiʻi Hawaiianisch Tau Latne Latin-Skript-Modell
Otjiherero produzierte Filme Herero hz Latne Latin-Skript-Modell
Ilonggo Hiligaynon hallo Latne Latin-Skript-Modell
Jaku-Iban Iban Biba Latne Latin-Skript-Modell
Asụsụ-Ibobo Igbo ig Latne Latin-Skript-Modell
Ilokano Iloko Ilo Latne Latin-Skript-Modell
Taqbaylit Kabyle produzierte Filme Kab Latne Latin-Skript-Modell
Jingpho Kochin Kac Latne Latin-Skript-Modell
Kalaallisut Kalaallisut kl Latne Latin-Skript-Modell
Kikamba Kikamba Kam Latne Latin-Skript-Modell
Kanuri Kanuri kr Latne Latin-Skript-Modell
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak Kaa Zylinder Kyrillisches Skriptmodell
Ka-Kitien-Kasi Khasi Kha Latne Latin-Skript-Modell
Güĩüyũ Kikuyu ki Latne Latin-Skript-Modell
Kinyarwanda Kinyarwanda RMZ Latne Latin-Skript-Modell
коми кыв Komi Kv Zylinder Kyrillisches Skriptmodell
Kikongo Kongo Gkg Latne Latin-Skript-Modell
Kosraeanisch Kosraeanisch Kos Latne Latin-Skript-Modell
Oshikwanama Kuyanay kJ Latne Latin-Skript-Modell
Ngala Lingala ln Latne Latin-Skript-Modell
Plattätt, Platteutsch, Nedersakisch Niederdeutsch .s Latne Latin-Skript-Modell
SiLozi Lozi Loz Latne Latin-Skript-Modell
Kilbuba Luba-Katanga Lu Latne Latin-Skript-Modell
Dholuo Luo Luo Latne Latin-Skript-Modell
Madhura, Basa Mathura, بَهاسَ مَدورا Madura Verärgert Latne Latin-Skript-Modell
Malagasy Malagasy mg Latne Latin-Skript-Modell
Mandina, لغة مندنكا Mandingo Mann Latne Latin-Skript-Modell
Geilg (Gailck) Manx gv Latne Latin-Skript-Modell
TeerāM ori Maori mi Latne Latin-Skript-Modell
Ebon Marshallisch Mhm Latne Latin-Skript-Modell
Mɛnde Yay Mende men Latne Latin-Skript-Modell
Mittelenglisch Mittelenglisch Englisch Latne Latin-Skript-Modell
Mittellhocheutsch Mitteldeutschland gmhm Latne Latin-Skript-Modell
Baso Minangkabau, باسو مينڠكاباو Minangkabauisch Min. Latne Latin-Skript-Modell
Kanienʼkéha Mohawk Moh Latne Latin-Skript-Modell
Nkundu Mongolei lol Latne Latin-Skript-Modell
Nāhuatl Nahuatl nah Latne Latin-Skript-Modell
Dinébaad Navajo NSF Latne Latin-Skript-Modell
Ndonga Ndonga ng Latne Latin-Skript-Modell
Ko e Vagahau Niuē Niueanisch Niu Latne Latin-Skript-Modell
Simbabwe Nord-Ndebele . Latne Latin-Skript-Modell
Sesotho Sa Leboa Nord-Sotho NSF Latne Latin-Skript-Modell
Chichewa (Chinyanja) Chichewa ny Latne Latin-Skript-Modell
Runyankore Nyankale Jenn Latne Latin-Skript-Modell
Chitonga produzierte Filme Nyasa Tonga Tog Latne Latin-Skript-Modell
Appolo Logo: Nzima Nani Latne Latin-Skript-Modell
Okzitanisch, Lenga d'òc, provenzal Okzitanisch OC Latne Latin-Skript-Modell
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa JO Latne Latin-Skript-Modell
Ænglisc, Englisc, Anglisc Altenglisch Ang Latne Latin-Skript-Modell
Frankreich, François, Romanz Altes Französische Fro Latne Latin-Skript-Modell
Diutisk (Alchochdeutsch) Altdeutsch Goh Latne Latin-Skript-Modell
Dungǫ-Dunga Altnor Ohne Latne Latin-Skript-Modell
Okzitanischer Akane Alte Provenzale Profi Latne Latin-Skript-Modell
ирон ӕвзаг Ossetisch os Zylinder Kyrillisches Skriptmodell
Kapampangan Pampanga PAM Latne Latin-Skript-Modell
Salatan Pangasinan Pangasinensisch Seitennummer Latne Latin-Skript-Modell
Papiamentu Papiamento Pap Latne Latin-Skript-Modell
Português (Portugal) Portugiesisch pt-PT Latn Europa pt
Kechua / Runa Simi Quechua Quar Latne Latin-Skript-Modell
Rumanschisch Rätoromanisch rm Latne Latin-Skript-Modell
Romani čhib Romani Rom Latne Latin-Skript-Modell
Ikirundi Kirundi rn Latne Latin-Skript-Modell
Jakutisch Jakutisch Sarah Zylinder Kyrillisches Skriptmodell
Gagana faʻa Sāmoa Samoanisch sm Latne Latin-Skript-Modell
yângâ tî sängö Sango sg Latne Latin-Skript-Modell
(Braid) Schotten, Lutscher, dorisch Scots Sco Latne Latin-Skript-Modell
Güidhlig Schottisch-Gälisch gd Latne Latin-Skript-Modell
ChiShona Shona sn Latne Latin-Skript-Modell
Songhay Songhai Sohn Latne Latin-Skript-Modell
Sesotho Süd-Sotho-Sprache st Latne Latin-Skript-Modell
Español (lat. Alphabet) Spanisch es-419 Latn Lateinamerikanisch es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanesisch su Latne Latin-Skript-Modell
Swasi Siswati ss Latne Latin-Skript-Modell
Reo Tahiti Tahitianisch Ty Latne Latin-Skript-Modell
тоҷикӣ Tadschikisch tg Zylinder Kyrillisches Skriptmodell
татар теле Tatarisch tt Zylinder Kyrillisches Skriptmodell
KʌThemnɛ Temne Tem Latne Latin-Skript-Modell
Lea Faka-Tonga Tongaisch bis Latne Latin-Skript-Modell
Logo: Xitonga Tsonga ts Latne Latin-Skript-Modell
Setswana Setswana tn Latne Latin-Skript-Modell
Türkmençe Turkmenisch tk Latne Kyrillisches Skriptmodell
удмурт кыл Udmurten UDM Zylinder Kyrillisches Skriptmodell
Logo: Tshivenvea Venda Ve Latne Latin-Skript-Modell
Vokale Votisch Vot Zylinder Kyrillisches Skriptmodell
Fryssk Westfriesisch fy Latne Latin-Skript-Modell
Wolof Wolof Wo. Latne Latin-Skript-Modell
IsiXhosa Xhosa xh Latne Latin-Skript-Modell
Èdè Jörùbá Yoruba yo Latne Latin-Skript-Modell
Diidxazá Zapotetisch Zap Latne Latin-Skript-Modell