OCR-Sprachunterstützung

Die Texterkennungsfunktion der Cloud Vision API erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.

Die Angabe eines Sprachhinweises für den Dienst ist nicht erforderlich, aber möglich, falls der Dienst die Sprache in Ihrem Bild nicht erkennt.

Seit der Veröffentlichung des GA-Release Handschrift-Texterkennung müssen Bilder, die Handschrift enthalten, bei der Verwendung von DOCUMENT_TEXT_DETECTION nicht mehr mit einem languageHints-Flag für Handschrift versehen werden.

Optionale Sprachhinweise werden bei TEXT_DETECTION- und DOCUMENT_TEXT_DETECTION-Anfragen im ImageContext der Anfrage als Liste von languageHints angegeben.

Jeder Sprachcodeparameter besteht üblicherweise aus einer BCP-47-Kennung. Diese Parameter können in der Form Sprache-Region festgelegt werden. Dabei bezieht sich Sprache auf die Standardsprache und die optionale Angabe für Region auf eine Region (in der Regel eine Länderkennung) mit einem bestimmten Dialekt. Beispiel: Chinesisch kann als Vereinfachtes Chinesisch (zh-Hans) dargestellt werden, wie es in der Volksrepublik China geschrieben wird, oder als Traditionelles Chinesisch in der taiwanischen Schreibweise (zh-Hant).

Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:

Unterstützte Sprachen sind diejenigen, denen wir Priorität einräumen und für die wir regelmäßig Leistungsbewertungen vornehmen.
Experimentelle Sprachen sind Sprachen, die aktiv entwickelt, aber nicht regelmäßig ausgewertet werden.
Zugeordnete Sprachen werden einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet, um sie zu unterstützen. "en-GB" wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als "en". Wir bemühen uns zwar, den korrekten Code der zugeordneten Sprache im Feld für die Sprache der Entität zurückzugeben, doch kann es bei zugeordneten Sprachen eher als bei vollständig oder experimentell unterstützten Sprachen vorkommen, dass sie als eine ähnliche Sprache und somit falsch identifiziert werden.

Weiter unter finden Sie eine Liste der Sprachen (mit den zugehörigen languageHint-Codes), die von TEXT_DETECTION und DOCUMENT_TEXT_DETECTION unterstützt werden.

Wenn der Sprachhinweis leer gelassen wird, versuchen wir, die am besten passende Sprache automatisch zu erkennen. Der Endpunkt TEXT_DETECTION erkennt nur einen Teil der unterstützten Sprachen automatisch, während der Endpunkt DOCUMENT_TEXT_DETECTION alle unterstützten Sprachen automatisch erkennt.

Unterstützte Sprachen

Die folgenden Sprachen werden priorisiert und regelmäßig ausgewertet.

Wenn Sie nach bestimmten Features filtern möchten, geben Sie die gewünschte Sprache ein oder wählen Sie sie direkt aus dem Drop-down-Menü aus:

Sprache	Sprache (deutscher Name)	`languageHints`-Code	Script	Hinweise
Afrikaans	Afrikaans	`af`	`Latn`
shqip	Albanisch	`sq`	`Latn`
العربية	Arabisch	`ar`	`Arab`	Moderner Standard
Հայ	Armenisch	`hy`	`Armn`
беларуская	Belarussisch	`be`	`Cyrl`
বাংলা	Bengalisch	`bn`	`Beng`
български	Bulgarisch	`bg`	`Cyrl`
Català	Katalanisch	`ca`	`Latn`
普通话	Chinesisch	`zh`	`Hans/Hant`
Hrvatski	Kroatisch	`hr`	`Latn`
Čeština	Tschechisch	`cs`	`Latn`
Dansk	Dänisch	`da`	`Latn`
Nederlands	Niederländisch	`nl`	`Latn`
English	Englisch	`en`	`Latn`	Amerikanisch
Eesti keel	Estnisch	`et`	`Latn`
Filipino	Philippinisch	`fil`	`Latn`
Suomi	Finnisch	`fi`	`Latn`
Français	Französisch	`fr`	`Latn`	Europäisch
Deutsch	Deutsch	`de`	`Latn`
Ελληνικά	Griechisch	`el`	`Grek`
ગુજરાતી	Gujarati	`gu`	`Gujr`
עברית	Hebräisch	`iw`	`Hebr`
हिन्दी	Hindi	`hi`	`Deva`
Magyar	Ungarisch	`hu`	`Latn`
Íslenska	Isländisch	`is`	`Latn`
Bahasa Indonesia	Indonesisch	`id`	`Latn`
Italiano	Italienisch	`it`	`Latn`
日本語	Japanisch	`ja`	`Jpan`
ಕನ್ನಡ	Kannada	`kn`	`Knda`
ភាសាខ្មែរ	Khmer	`km`	`Khmr`
한국어	Koreanisch	`ko`	`Kore`
ລາວ	Lao	`lo`	`Laoo`
Latviešu	Lettisch	`lv`	`Latn`
Lietuvių	Litauisch	`lt`	`Latn`
Македонски	Mazedonisch	`mk`	`Cyrl`
Bahasa Melayu	Malaiisch	`ms`	`Latn`
മലയാളം	Malayalam	`ml`	`Mlym`
मराठी	Marathi	`mr`	`Deva`
नेपाली	Nepalesisch	`ne`	`Deva`
Norsk	Norwegisch	`no`	`Latn`	Bokmål
فارسی	Persisch	`fa`	`Arab`
Polski	Polnisch	`pl`	`Latn`
Português	Portugiesisch	`pt`	`Latn`	Brasilianisch
ਪੰਜਾਬੀ	Punjabi	`pa`	`Guru`	Gurmukhi
Română	Rumänisch	`ro`	`Latn`
Русский	Russisch	`ru`	`Cyrl`
Русский (старая орфография)	Russisch	`ru-PETR1708`	`Cyrl`	Alte Rechtschreibung
Српски	Serbisch	`sr`	`Cyrl`
Српски (латиница)	Serbisch	`sr-Latn`	`Latn`
Slovenčina	Slowakisch	`sk`	`Latn`
Slovenščina	Slowenisch	`sl`	`Latn`
Español	Spanisch	`es`	`Latn`	Europäisch
Svenska	Schwedisch	`sv`	`Latn`
Tagalog	Tagalog	`tl`	`Latn`
தமிழ்	Tamil	`ta`	`Taml`
తెలుగు	Telugu	`te`	`Telu`
ไทย	Thai	`th`	`Thai`
Türkçe	Türkisch	`tr`	`Latn`
Українська	Ukrainisch	`uk`	`Cyrl`
Tiếng Việt	Vietnamesisch	`vi`	`Latn`
Yiddish	Jiddisch	`yi`	`Hebr`

Experimentelle Sprachen

Die folgenden Sprachen befinden sich in der Entwicklungsphase und werden noch nicht regelmäßig evaluiert.

Sprache	Sprache (deutscher Name)	`languageHints`-Code	Script	Hinweise
አማርኛ	Amharisch	`am`	`Ethi`
Αρχαία ελληνικά	Altgriechisch	`grc`	`Grek`
অসমীয়া	Assamesisch	`as`	`Beng`
Azərbaycan	Aserbaidschanisch	`az`	`Latn`
Azərbaycan (qədim yazı)	Aserbaidschanisch	`az-Cyrl`	`Cyrl`	Alte Rechtschreibung
Euskara	Baskisch	`eu`	`Latn`
Bosanski	Bosnisch	`bs`	`Latn`
မြန်မာ	Burmesisch	`my`	`Mymr`
Cebuano	Cebuano	`ceb`	`Latn`
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ	Cherokee	`chr`	`Cher`
dhivehi, dhivehi-bas	Dhivehi	`dv`	`Thaa`
རྫོང་ཁ	Dzonkha	`dz`	`Tibt`
Esperanto	Esperanto	`eo`	`Latn`
Galego	Galizisch	`gl`	`Latn`
ქართული	Georgisch	`ka`	`Geor`
Kreyòl Ayisyen	Haitianisch	`ht`	`Latn`
Gaeilge	Irisch	`ga`	`Latn`
Jawa	Javanisch	`jv`	`Latn`
Қазақ	Kasachisch	`kk`	`Cyrl`
Kirghiz	Kirgisisch	`ky`	`Cyrl`
Latine	Latein	`la`	`Latn`
Malti	Maltesisch	`mt`	`Latn`
Монгол	Mongolisch	`mn`	`Cyrl`
ଓଡ଼ିଆ	Oriya	`or`	`Orya`
پښتو	Paschtu	`ps`	`Arab`
संस्कृतम्	Sanskrit	`sa`	`Deva`
සිංහල	Singhalesisch	`si`	`Sinh`
Swahili	Suaheli	`sw`	`Latn`
leššānā Suryāyā	Syrisch	`syr`	`Syriac`
བོད་སྐད་	Tibetisch	`bo`	`Tibt`
ትግርኛ	Tigirinya	`ti`	`Ethi`
اردو	Urdu	`ur`	`Arab`
oʻzbekcha	Usbekisch	`uz`	`Latn`	Latein
oʻzbekcha	Usbekisch	`uz-Cyrl`	`Cyrl`	Alte Rechtschreibung
Cymraeg	Walisisch	`cy`	`Latn`
IsiZulu	Zulu	`zu`	`Latn`

Zugeordnete Sprachen

Die folgenden Sprachen sind einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet.

Sprache	Sprache (deutscher Name)	`languageHints`-Code	Script	Hinweise
بهسا اچيه	Achinesisch	`ace`	`Latn`	Lateinisches Modell
Lwo	Acholi	`ach`	`Latn`	Lateinisches Modell
Dangme	Adangme	`ada`	`Latn`	Lateinisches Modell
Akan	Akan	`ak`	`Latn`	Lateinisches Modell
Anicinâbemowin	Algonquinian	`alg`	`Latn`	Lateinisches Modell
Mapudungu	Araucanian/Mapuche	`arn`	`Latn`	Lateinisches Modell
Asturianu	Asturisch	`ast`	`Latn`	Lateinisches Modell
Dene	Athapaskisch	`ath`	`Latn`	Lateinisches Modell
Aymar aru	Aymara	`ay`	`Latn`	Lateinisches Modell
Bhāṣa Bali	Balinesisch	`ban`	`Latn`	Lateinisches Modell
Bamanankan	Bambara	`bm`	`Latn`	Lateinisches Modell
Narrow Bantu	Bantu	`bnt`	`Latn`	Lateinisches Modell
башҡорт теле	Baschkirisch	`ba`	`Cyrl`	Kyrillisches Modell
Toba–Batak	Batak	`btk`	`Latn`	Lateinisches Modell
Chibemba	Bemba	`bem`	`Latn`	Lateinisches Modell
Bikol Naga	Bikol	`bik`	`Latn`	Lateinisches Modell
Bichelamar	Bislama	`bi`	`Latn`	Lateinisches Modell
Brezhoneg	Bretonisch	`br`	`Latn`	Lateinisches Modell
нохчийн мотт / noxçiyn mott	Tschetschenisch	`ce`	`Cyrl`	Kyrillisches Modell
汉语	Chinesisch (Mandarin, vereinfacht,)	`zh-Hans`	`Hans`	Chinesisches Modell
漢語	Chinesisch (Mandarin, traditionell)	`zh-Hant`	`Hant`	Chinesisches Modell
普通話	Chinesisch (Mandarin, Hongkong)	`zh-Hant-HK`	`Hant`	Chinesisches Modell
Chahta'	Choctaw	`cho`	`Latn`	Lateinisches Modell
Чӑвашла	Tschuwaschisch	`cv`	`Cyrl`	Kyrillisches Modell
Cree–Montagnais–Naskapi	Cree	`cr`	`Latn`	Lateinisches Modell
Mvskoke	Muskogee	`mus`	`Latn`	Lateinisches Modell
qırımtatar tili, къырымтатар тили	Krimtatarisch	`crh`	`Latn`	Kyrillisches Modell
Dakhótiyapi, Dakȟótiyapi	Dakota	`dak`	`Latn`	Lateinisches Modell
Douala	Duala	`dua`	`Latn`	Lateinisches Modell
Ikɔ Efik	Efik	`efi`	`Latn`	Lateinisches Modell
English (British)	Englisch (Britisch)	`en-GB`	`Latn`	Lateinisches Modell
Èʋegbe	Ewe	`ee`	`Latn`	Lateinisches Modell
føroyskt mál	Färöisch	`fo`	`Latn`	Lateinisches Modell
Na Vosa Vakaviti	Fidschianisch	`fj`	`Latn`	Lateinisches Modell
fɔ̀ngbè	Fon	`fon`	`Latn`	Lateinisches Modell
Français canadien	Französisch (Kanada)	`fr-CA`	`Latn`	Lateinisches Modell
Fulani, Fulah, Peul	Fulfulde	`ff`	`Latn`	Lateinisches Modell
Gã	Ga	`gaa`	`Latn`	Lateinisches Modell
Luganda	Ganda	`lg`	`Latn`	Lateinisches Modell
Basa Gayo	Gayo	`gay`	`Latn`	Lateinisches Modell
Kiribati	Kiribatisch	`gil`	`Latn`	Lateinisches Modell
Gothic	Gotisch	`got`	`Latn`	Lateinisches Modell
Guaraní	Guarani	`gn`	`Latn`	Lateinisches Modell
Harshen/Halshen Hausa هَرْشَن هَوْسَ	Hausa	`ha`	`Latn`	Lateinisches Modell
ʻŌlelo Hawaiʻi	Hawaiisch	`haw`	`Latn`	Lateinisches Modell
Otjiherero	Herero	`hz`	`Latn`	Lateinisches Modell
Ilonggo	Hiligaynon	`hil`	`Latn`	Lateinisches Modell
Jaku Iban	Iban	`iba`	`Latn`	Lateinisches Modell
Asụsụ Igbo	Igbo	`ig`	`Latn`	Lateinisches Modell
Ilokano	Ilokano	`ilo`	`Latn`	Lateinisches Modell
Taqbaylit	Kabylisch	`kab`	`Latn`	Lateinisches Modell
Jingpho	Kachin	`kac`	`Latn`	Lateinisches Modell
Kalaallisut	Kalaallisut	`kl`	`Latn`	Lateinisches Modell
Kikamba	Kikamba	`kam`	`Latn`	Lateinisches Modell
Kanuri	Kanuri	`kr`	`Latn`	Lateinisches Modell
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى	Karakalpaken	`kaa`	`Cyrl/Latn`	Kyrillisches Modell
Ka Ktien Khasi	Khasi	`kha`	`Latn`	Lateinisches Modell
Gĩkũyũ	Kikuyu	`ki`	`Latn`	Lateinisches Modell
Kinyarwanda	Kinyarwanda	`rw`	`Latn`	Lateinisches Modell
коми кыв	Komi	`kv`	`Cyrl`	Kyrillisches Modell
Kikongo	Kongo	`kg`	`Latn`	Lateinisches Modell
Kosraean	Kosraeanisch	`kos`	`Latn`	Lateinisches Modell
Oshikwanyama	Kuanyama	`kj`	`Latn`	Lateinisches Modell
Ngala	Lingala	`ln`	`Latn`	Lateinisches Modell
Plattdütsch, Plattdeutsch, Nedersaksisch	Plattdeutsch	`nds`	`Latn`	Lateinisches Modell
siLozi	Lozi	`loz`	`Latn`	Lateinisches Modell
Kiluba	Luba-Katanga	`lu`	`Latn`	Lateinisches Modell
Dholuo	Luo	`luo`	`Latn`	Lateinisches Modell
Madhura, Basa Mathura, بَهاسَ مَدورا	Maduresisch	`mad`	`Latn`	Lateinisches Modell
Malagasy	Malagasy	`mg`	`Latn`	Lateinisches Modell
Mandinka, لغة مندنكا	Mandingo	`man`	`Latn`	Lateinisches Modell
Gaelg, Gailck	Manx	`gv`	`Latn`	Lateinisches Modell
Te reo Māori	Maori	`mi`	`Latn`	Lateinisches Modell
Ebon	Marshallesisch	`mh`	`Latn`	Lateinisches Modell
Mɛnde yia	Mende	`men`	`Latn`	Lateinisches Modell
Middle English	Mittelenglisch	`enm`	`Latn`	Lateinisches Modell
Mittelhochdeutsch	Mittelhochdeutsch	`gmh`	`Latn`	Lateinisches Modell
Baso Minangkabau, باسو مينڠكاباو	Minangkabauisch	`min`	`Latn`	Lateinisches Modell
Kanienʼkéha	Mohawk	`moh`	`Latn`	Lateinisches Modell
Nkundu	Mongo	`lol`	`Latn`	Lateinisches Modell
Nāhuatl	Nahuatl	`nah`	`Latn`	Lateinisches Modell
Diné bizaad	Navajo	`nv`	`Latn`	Lateinisches Modell
Ndonga	Ndonga	`ng`	`Latn`	Lateinisches Modell
ko e vagahau Niuē	Niueanisch	`niu`	`Latn`	Lateinisches Modell
Zimbabwe Ndebele	Nord-Ndebele	`nd`	`Latn`	Lateinisches Modell
Sesotho sa Leboa	Nord-Sotho	`nso`	`Latn`	Lateinisches Modell
Chichewa, Chinyanja	Chichewa	`ny`	`Latn`	Lateinisches Modell
Runyankore	Nyankole	`nyn`	`Latn`	Lateinisches Modell
Chitonga	Nyasa Tonga	`tog`	`Latn`	Lateinisches Modell
Appolo	Nzima	`nzi`	`Latn`	Lateinisches Modell
Occitan, lenga d'òc, provençal	Okzitanisch	`oc`	`Latn`	Lateinisches Modell
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ	Ojibwa	`oj`	`Latn`	Lateinisches Modell
Ænglisc, Englisc, Anglisc	Altenglisch	`ang`	`Latn`	Lateinisches Modell
Franceis, François, Romanz	Altfranzösisch	`fro`	`Latn`	Lateinisches Modell
Diutisk, Althochdeutsch	Althochdeutsch	`goh`	`Latn`	Lateinisches Modell
Dǫnsk tunga	Altnordisch	`non`	`Latn`	Lateinisches Modell
Occitan ancian	Altprovenzalisch	`pro`	`Latn`	Lateinisches Modell
ирон ӕвзаг	Ossetisch	`os`	`Cyrl`	Kyrillisches Modell
Kapampangan	Pampanga	`pam`	`Latn`	Lateinisches Modell
Salitan Pangasinan	Pangasinensisch	`pag`	`Latn`	Lateinisches Modell
Papiamentu	Papiamento	`pap`	`Latn`	Lateinisches Modell
Português (Portugal)	Portugiesisch (europäisch)	`pt-PT`	`Latn`	Lateinisches Modell
Kechua / Runa Simi	Quechua	`qu`	`Latn`	Lateinisches Modell
Rumantsch	Rätoromanisch	`rm`	`Latn`	Lateinisches Modell
Romani čhib	Romani	`rom`	`Latn`	Lateinisches Modell
Ikirundi	Kirundi	`rn`	`Latn`	Lateinisches Modell
Sakha	Jakutisch	`sah`	`Cyrl`	Kyrillisches Modell
Gagana faʻa Sāmoa	Samoanisch	`sm`	`Latn`	Lateinisches Modell
yângâ tî sängö	Sango	`sg`	`Latn`	Lateinisches Modell
(Braid) Scots, Lallans, Doric	Schottisch	`sco`	`Latn`	Lateinisches Modell
Gàidhlig	Schottisches Gälisch	`gd`	`Latn`	Lateinisches Modell
chiShona	Shona	`sn`	`Latn`	Lateinisches Modell
Songhay	Songhai	`son`	`Latn`	Lateinisches Modell
Sesotho	Süd-Sotho	`st`	`Latn`	Lateinisches Modell
Español (Latinoamérica)	Spanisch (Lateinamerika)	`es-419`	`Latn`	Lateinisches Modell
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda	Sundanesisch	`su`	`Latn`	Lateinisches Modell
siSwati	Siswati	`ss`	`Latn`	Lateinisches Modell
Reo Tahiti	Tahitianisch	`ty`	`Latn`	Lateinisches Modell
тоҷикӣ	Tadschikisch	`tg`	`Cyrl`	Kyrillisches Modell
татар теле	Tatarisch	`tt`	`Cyrl/Latn`	Kyrillisches Modell
KʌThemnɛ	Temne	`tem`	`Latn`	Lateinisches Modell
lea faka-Tonga	Tongaisch	`to`	`Latn`	Lateinisches Modell
Xitsonga	Tsonga	`ts`	`Latn`	Lateinisches Modell
Setswana	Setswana	`tn`	`Latn`	Lateinisches Modell
Türkmençe	Turkmenisch	`tk`	`Latn`	Kyrillisches Modell
удмурт кыл	Udmurtisch	`udm`	`Cyrl`	Kyrillisches Modell
Tshivenḓa	Venda	`ve`	`Latn`	Lateinisches Modell
Vod	Wotisch	`vot`	`Cyrl/Latn`	Kyrillisches Modell
Frysk	Westfriesisch	`fy`	`Latn`	Lateinisches Modell
Wolof	Wolof	`wo`	`Latn`	Lateinisches Modell
isiXhosa	Xhosa	`xh`	`Latn`	Lateinisches Modell
Èdè Yorùbá	Yoruba	`yo`	`Latn`	Lateinisches Modell
Diidxazá	Zapotekisch	`zap`	`Latn`	Lateinisches Modell

Handschrift-Scripts

Die folgenden Scripts werden für die Handschrifterkennung unterstützt. In den obigen Sprachtabellen finden Sie die Sprachen, die das jeweilige Script verwenden.

Script	Name	Supportstufe
`Beng`	Bengalisch	Experimentell
`Cyrl`	Kyrillisch	Experimentell
`Deva`	Devanagari	Experimentell
`Grek`	Griechisch	Experimentell
`Hani`	Chinesisch	Experimentell
`Jpan`	Japanisch	Unterstützt
`Kore`	Koreanisch	Unterstützt
`Latn`	Latein	Unterstützt
`vi`	Vietnamesisch	Experimentell