OCR-Sprachunterstützung

Die Texterkennungsfunktion der Cloud Vision API erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.

Die Angabe eines Sprachhinweises für den Dienst ist nicht erforderlich, aber möglich, falls der Dienst die Sprache in Ihrem Bild nicht erkennt.

Seit der Veröffentlichung des GA-Release Handschrift-Texterkennung (Optical Character Recognition, OCR) müssen Bilder, die Handschrift enthalten, bei der Verwendung von DOCUMENT_TEXT_DETECTION nicht mehr mit einem Flag languageHints für Handschrift versehen werden.

Optionale Sprachhinweise werden bei TEXT_DETECTION- und DOCUMENT_TEXT_DETECTION-Anfragen im ImageContext der Anfrage als Liste von languageHints angegeben.

Jeder Sprachcodeparameter besteht üblicherweise aus einer BCP-47-Kennung. Diese Parameter können in der Form Sprache-Region festgelegt werden. Dabei bezieht sich Sprache auf die Standardsprache und die optionale Angabe für Region auf eine Region (in der Regel eine Länderkennung) mit einem bestimmten Dialekt. Beispiel: Chinesisch kann als Vereinfachtes Chinesisch (zh-Hans) dargestellt werden, wie es in der Volksrepublik China geschrieben wird, oder als Traditionelles Chinesisch in der taiwanischen Schreibweise (zh-Hant).

Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:

  1. Unterstützte Sprachen sind diejenigen, denen wir Priorität einräumen und bezüglich derer wir regelmäßig Leistungsbewertungen vornehmen.
  2. Experimentelle Sprachen sind Sprachen, die aktiv entwickelt, aber nicht regelmäßig ausgewertet werden.
  3. Zugeordnete Sprachen werden einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet, um sie zu unterstützen. "en-GB" wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als "en". Wir bemühen uns zwar, den korrekten Code der zugeordneten Sprache im Feld für die Sprache der Entität zurückzugeben, doch kann es bei zugeordneten Sprachen eher als bei vollständig oder experimentell unterstützten Sprachen vorkommen, dass sie als eine ähnliche Sprache und somit falsch identifiziert werden.

Weiter unter finden Sie eine Liste der Sprachen (mit den zugehörigen languageHint-Codes), die von TEXT_DETECTION und DOCUMENT_TEXT_DETECTION unterstützt werden.

Wenn der Sprachhinweis leer gelassen wird, versuchen wir, die am besten passende Sprache automatisch zu erkennen. Der Endpunkt TEXT_DETECTION erkennt nur einen Teil der unterstützten Sprachen automatisch, während der Endpunkt DOCUMENT_TEXT_DETECTION alle unterstützten Sprachen automatisch erkennt.

Unterstützte Sprachen

Die folgenden Sprachen werden priorisiert und regelmäßig ausgewertet.

Wenn Sie nach bestimmten Features filtern möchten, geben Sie die gewünschte Sprache ein oder wählen Sie sie direkt aus dem Drop-down-Menü aus:

Sprache Sprache (deutscher Name) languageHints-Code Skript/Notizen
Afrikaans Afrikaans af Latn
shqip Albanisch sq Latn
العربية Arabisch ar Modernes Hocharabisch
Հայ Armenisch hy Armn
беларускі Weißrussisch be Cyrl
বাংলা Bengalisch bn Beng
български Bulgarisch bg Cyrl
Català Katalanisch ca Latn
普通话 Chinesisch zh Hans/Hant
Hrvatski Kroatisch hr Latn
Čeština Tschechisch cs Latn
Dansk Dänisch da Latn
Nederlands Niederländisch nl Latn
Englisch Englisch en Latn; Amerikanisch
Eesti keel Estnisch et Latn
Filipino Filipino fil oder tl Latn
Suomi Finnisch fi Latn
Français Französisch fr Latn; Europäisch
Deutsch Deutsch de Latn
Ελληνικά Griechisch el Grek
ગુજરાતી Gujarati gu Gujr
עברית Hebräisch iw Hebr
हिन्दी Hindi hi Deva
Magyar Ungarisch hu Latn
Íslenska Isländisch ist Latn
Bahasa Indonesia Indonesisch id Latn
Italiano Italienisch it Latn
日本語 Japanisch ja Jpan
ಕನ್ನಡ Kannada kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Koreanisch ko Kore
ລາວ Lao lo Laoo
Latviešu Lettisch lv Latn
Lietuvių Litauisch lt Latn
Македонски Mazedonisch mk Cyrl
Bahasa Melayu Malaiisch ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepali ne Deva
Norsk Norwegisch no Latn; Bokmål
فارسی Persisch fa Arab
Polski Polnisch pl Latn
Português Portugiesisch pt Latn; Brazilian
ਪੰਜਾਬੀ Panjabi pa Guru; Gurmukhi
Română Rumänisch ro Latn
Русский Russisch ru Cyrl
Русский (старая орфография) Russisch ru-PETR1708 Cyrl: Alte Orthografie
Српски Serbisch sr Cyrl & Latn
Српски (латиница) Serbisch sr-Latn Latn
Slovenčina Slowakei sk Latn
Slovenščina Slowenisch sl Latn
Español Spanisch es Latn; Europäisch
Svenska Schwedisch sv Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Thailändisch th Thailändisch
Türkçe Türkisch tr Latn
Українська Ukrainisch uk Cyrl
Tiếng Việt Vietnamesisch vi Latn
Jiddisch Jiddisch yi Hebr

Experimentelle Sprachen

Die folgenden Sprachen befinden sich in der Entwicklungsphase und werden noch nicht regelmäßig evaluiert.

Sprache Sprache (deutscher Name) languageHints Code Skript/Notizen
አማርኛ Amharisch a.m. Ethi
Αρχαία ελληνικά Altgriechisch grc Grek
অসমীয়া Assamesisch as Beng
Azərbaycan Aserbaidschanisch az Latn
Azərbaycan (qədim yazı) Aserbaidschanisch az-Cyrl Cyrl: alte Orthografie
Euskara Baskisch EU Latn
Bosanski Bosnisch bs Latn
မြန်မာ Burmesisch my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Dhivehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galicisch gl Latn
ქართული Georgisch ka Geor
Kreyòl Ayisyen Kreolisch (Haiti) ht Latn
Gaeilge Irisch ga Latn
Jawa Javanisch jv Latn
Қазақ Kasachisch kk Cyrl
Kirgisisch Kirgisisch ky Cyrl
Latine Latein la Latn
Malti Maltesisch mt Latn
Монгол Mongolisch mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Paschtunisch ps Arab
संस्कृतम् Sanskrit sa Deva
සිංහල Singhalesisch si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Syrisch syr Syrisch
བོད་སྐད་ Tibetisch bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Usbekisch uz Latn; Latin
oʻzbekcha Usbekisch uz-Cyrl Cyrl: alte Orthografie
Cymraeg Walisisch cy Latn
IsiZulu Zulu zu Latn

Zugeordnete Sprachen

Die folgenden Sprachen sind einem anderen Sprachcode zugeordnet oder einem allgemeinen Zeichenerkenner.

Sprache Sprache (deutscher Name) languageHints-Code Skript/Notizen Zugeordnet zu
بهسا اچيه Achinesisch ace Latn Lateinisches Skriptmodell
Lwo Acholi ach Latn Lateinisches Skriptmodell
Dangme Adangme ada Latn Lateinisches Skriptmodell
Akan Akan ak Latn Lateinisches Skriptmodell
Anicinâbemowin Algonquinian alg Latn Lateinisches Skriptmodell
Mapudungu Araucanian/Mapuche arn Latn Lateinisches Skriptmodell
Asturianu Asturisch ast Latn Lateinisches Skriptmodell
Dene Athapaskisch ath Latn Lateinisches Skriptmodell
Aymar aru Aymara ay Latn Lateinisches Skriptmodell
Bhāṣa Bali Balinesisch sperren Latn Lateinisches Skriptmodell
Bamanankan Bambara bm Latn Lateinisches Skriptmodell
Enges Bantu Bantu bnt Latn Lateinisches Skriptmodell
башҡорт теле Baschkirisch ba Cyrl Kyrillisches Skriptmodell
Toba–Batak Batak btk Latn Lateinisches Skriptmodell
Chibemba Bemba bem Latn Lateinisches Skriptmodell
Bikol Naga Bikol bik Latn Lateinisches Skriptmodell
Bichelamar Bislama bi Latn Lateinisches Skriptmodell
Brezhoneg Bretonisch br Latn Lateinisches Skriptmodell
нохчийн мотт/noxçiyn mott Tschetschenisch ce Cyrl Kyrillisches Skriptmodell
汉语 Chinesisch zh-Hans Hans; Vereinfacht; Mandarin zh
漢語 Chinesisch zh-Hant Hant; Traditionell; Mandarin zh
普通話 Chinesisch zh-Hant-HK Hant; Mandarin; Hongkong zh
Chahta' Choctaw cho Latn Lateinisches Skriptmodell
Чӑвашла Tschuwaschisch cv Cyrl Kyrillisches Skriptmodell
Cree–Montagnais–Naskapi Cree cr Latn Lateinisches Skriptmodell
Mvskoke Muskogee mus Latn Lateinisches Skriptmodell
qırımtatar tili, къырымтатар тили Krimtatarisch crh Latn Kyrillisches Skriptmodell
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Lateinisches Skriptmodell
Douala Duala dua Latn Lateinisches Skriptmodell
Ikɔ Efik Efik efi Latn Lateinisches Skriptmodell
Englisch (Britisch) Englisch en-GB Latn; Britisch en
Èʋegbe Ewe ee Latn Lateinisches Skriptmodell
føroyskt mál Färöisch fo Latn Lateinisches Skriptmodell
Na Vosa Vakaviti Fidschi fj Latn Lateinisches Skriptmodell
fɔ̀ngbè Fon fon Latn Lateinisches Skriptmodell
Français canadien Französisch fr-CA Latn; Kanadisch fr
Fulani, Fulah, Peul Fulfulde ff Latn Lateinisches Skriptmodell
Ga gaa Latn Lateinisches Skriptmodell
Luganda Ganda lg Latn Lateinisches Skriptmodell
Basa Gayo Gayo gay Latn Lateinisches Skriptmodell
Kiribati Kiribatisch gil Latn Lateinisches Skriptmodell
Gotisch Gotisch got Latn Lateinisches Skriptmodell
Guaraní Guarani gn Latn Lateinisches Skriptmodell
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Lateinisches Skriptmodell
ʻŌlelo Hawaiʻi Hawaiianisch haw Latn Lateinisches Skriptmodell
Otjiherero Herero hz Latn Lateinisches Skriptmodell
Ilonggo Hiligaynon hil Latn Lateinisches Skriptmodell
Jaku Iban Iban iba Latn Lateinisches Skriptmodell
Asụsụ Igbo Igbo ig Latn Lateinisches Skriptmodell
Ilokano Ilokano ilo Latn Lateinisches Skriptmodell
Taqbaylit Kabylisch kab Latn Lateinisches Skriptmodell
Jingpho Kachin kac Latn Lateinisches Skriptmodell
Kalaallisut Kalaallisut kl Latn Lateinisches Skriptmodell
Kikamba Kikamba kam Latn Lateinisches Skriptmodell
Kanuri Kanuri kr Latn Lateinisches Skriptmodell
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Kyrillisches Skriptmodell
Ka Ktien Khasi Khasi kha Latn Lateinisches Skriptmodell
Gĩkũyũ Kikuyu ki Latn Lateinisches Skriptmodell
Kinyarwanda Kinyarwanda rw Latn Lateinisches Skriptmodell
коми кыв Komi kv Cyrl Kyrillisches Skriptmodell
Kikongo Kongo kg Latn Lateinisches Skriptmodell
Kosraeanisch Kosraeanisch kos Latn Lateinisches Skriptmodell
Oshikwanyama Kuanyama kj Latn Lateinisches Skriptmodell
Ngala Lingala ln Latn Lateinisches Skriptmodell
Plattdütsch, Plattdeutsch, Nedersaksisch Plattdeutsch nd Latn Lateinisches Skriptmodell
siLozi Lozi loz Latn Lateinisches Skriptmodell
Kiluba Luba-Katanga lu Latn Lateinisches Skriptmodell
Dholuo Luo luo Latn Lateinisches Skriptmodell
Madhura, Basa Mathura, بَهاسَ مَدورا Madura mad Latn Lateinisches Skriptmodell
Malagasy Malagasy mg Latn Lateinisches Skriptmodell
Mandinka, لغة مندنكا Mandingo Mann Latn Lateinisches Skriptmodell
Gaelg, Gailck Manx gv Latn Lateinisches Skriptmodell
Te reo Māori Maori mi Latn Lateinisches Skriptmodell
Ebon Marshallesisch mh Latn Lateinisches Skriptmodell
Mɛnde yia Mende men Latn Lateinisches Skriptmodell
Mittelenglisch Mittelenglisch enm Latn Lateinisches Skriptmodell
Mittelhochdeutsch Mittelhochdeutsch gmh Latn Lateinisches Skriptmodell
Baso Minangkabau, باسو مينڠكاباو Minangkabauisch Min. Latn Lateinisches Skriptmodell
Kanienʼkéha Mohawk moh Latn Lateinisches Skriptmodell
Nkundu Mongo lol Latn Lateinisches Skriptmodell
Nāhuatl Nahuatl nah Latn Lateinisches Skriptmodell
Diné bizaad Navajo nv Latn Lateinisches Skriptmodell
Ndonga Ndonga ng Latn Lateinisches Skriptmodell
ko e vagahau Niuē Niueanisch niu Latn Lateinisches Skriptmodell
Zimbabwe Ndebele Nord-Ndebele nd Latn Lateinisches Skriptmodell
Sesotho sa Leboa Nord-Sotho nso Latn Lateinisches Skriptmodell
Chichewa, Chinyanja Chichewa ny Latn Lateinisches Skriptmodell
Runyankore Nyankole nyn Latn Lateinisches Skriptmodell
Chitonga Nyasa Tonga tog Latn Lateinisches Skriptmodell
Appolo Nzima nzi Latn Lateinisches Skriptmodell
Occitan, lenga d'òc, provençal Okzitanisch oc Latn Lateinisches Skriptmodell
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Lateinisches Skriptmodell
Ænglisc, Englisc, Anglisc Altenglisch ang Latn Lateinisches Skriptmodell
Franceis, François, Romanz Altfranzösisch fro Latn Lateinisches Skriptmodell
Diutisk, Althochdeutsch Althochdeutsch goh Latn Lateinisches Skriptmodell
Dǫnsk tunga Altnordisch non Latn Lateinisches Skriptmodell
Okzitanisch Altprovenzalisch pro Latn Lateinisches Skriptmodell
ирон ӕвзаг Ossetisch os Cyrl Kyrillisches Skriptmodell
Kapampangan Pampanga pam Latn Lateinisches Skriptmodell
Salitan Pangasinan Pangasinensisch pag Latn Lateinisches Skriptmodell
Papiamentu Papiamento pap Latn Lateinisches Skriptmodell
Português (Portugal) Portugiesisch pt-PT Latn; Europäisch pt
Kechua/Runa Simi Quechua qu Latn Lateinisches Skriptmodell
Rumantsch Rätoromanisch rm Latn Lateinisches Skriptmodell
Romani čhib Romani rom Latn Lateinisches Skriptmodell
Ikirundi Kirundi rn Latn Lateinisches Skriptmodell
Jakutisch Jakutisch sah Cyrl Kyrillisches Skriptmodell
Gagana faʻa Sāmoa Samoanisch sm Latn Lateinisches Skriptmodell
yângâ tî sängö Sango sg Latn Lateinisches Skriptmodell
(Braid) Scots, Lallans, Doric Schottisch sco Latn Lateinisches Skriptmodell
Gàidhlig Schottisch-Gälisch gd Latn Lateinisches Skriptmodell
chiShona Shona sn Latn Lateinisches Skriptmodell
Songhay Songhai son Latn Lateinisches Skriptmodell
Sesotho Süd-Sotho-Sprache st Latn Lateinisches Skriptmodell
Español (Latinoamérica) Spanisch es-419 Latn; Lateinamerikanisch es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanesisch su Latn Lateinisches Skriptmodell
siSwati Siswati ss Latn Lateinisches Skriptmodell
Reo Tahiti Tahitianisch ty Latn Lateinisches Skriptmodell
тоҷикӣ Tadschikisch tg Cyrl Kyrillisches Skriptmodell
татар теле Tatarisch tt Cyrl/Latn Kyrillisches Skriptmodell
KʌThemnɛ Temne tem Latn Lateinisches Skriptmodell
lea faka-Tonga Tongaisch bis Latn Lateinisches Skriptmodell
Xitsonga Tsonga ts Latn Lateinisches Skriptmodell
Setswana Setswana tn Latn Lateinisches Skriptmodell
Türkmençe Turkmenisch tk Latn Kyrillisches Skriptmodell
удмурт кыл Udmurten udm Cyrl Kyrillisches Skriptmodell
Tshivenḓa Venda ve Latn Lateinisches Skriptmodell
Vod Wotisch vot Cyrl/Latn Kyrillisches Skriptmodell
Frysk Westfriesisch fy Latn Lateinisches Skriptmodell
Wolof Wolof wo Latn Lateinisches Skriptmodell
isiXhosa Xhosa xh Latn Lateinisches Skriptmodell
Èdè Yorùbá Yoruba yo Latn Lateinisches Skriptmodell
Diidxazá Zapotec zap Latn Lateinisches Skriptmodell